Список форумов |  Добавить сообщение |  Правила |  11.09.2025, четверг, 16:52:15
СПИСОК ФОРУМОВ
11.09.2025
16:11 Главная гостевая книга библиотеки(5855)
09:07 Обо всем - мнения(3149)
06.09.2025
15:23 "Разыскивается песня", доска объявлений(5441)
02.09.2025
12:08 "Разыскиваются книжки", доска объявлений(15508)
10:11 Проблемы OCR и электронных библиотек(1973)
16.08.2025
07:39 Книжки, которые скоро будут выложены(56)
02.05.2025
21:25 О возвышенной поэзии(1593)
24.02.2025
13:09 Книжки, которые стоит прочитать(5230)
13:05 Водный и всякий туризм(87)
22.02.2025
06:11 Русские впечатления о заграничной жизни(9443)
05:34 Мнения читателей о дизайне библиотеки(1479)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 26.09.2003
356. Sokolov, N.Novgorod (sokolov_av@pochtamt.ru) 20:52:13 [ответить]
      > 355. Zmiy.
     
      > Вопрос на засыпку :
      >
      > Как в ФР найти символ "конец абзаца"???
      > (не путайте с символом разрыв строки!)
      А что - в 7-ом уже есть подержка подобных замен? Или имеется в виду копание в самих frf-файлах?


355. Zmiy, Минск (zmiy@inbox.ru) 12:19:59 [ответить]
     
      Вопрос на засыпку :
     
      Как в ФР найти символ "конец абзаца"???
      (не путайте с символом разрыв строки!)


354. Zmiy, Минск (zmiy@inbox.ru) 01:36:14 [ответить]
      Всем! Всем! Всем!
     
      Вот же блин невнимательность!
      Показали мне в ФР7 возможность сохранения текста как было в ФР4 - с форматированием пробелами...
      Опции-Распознование-Тип страницы-Форматированный пробелами текст, но нужно ставить эту опцию перед распознованием... Так, что интересно - эта опция есть и в ФР5 и в ФР6... А я Вам тут мозги пудрю, а Вы не можете указать на решение... --------------;-)
      При таком варианте нет проблем с абзацами, которые остались при сохранении в вордовские форматы... Так что учтите, что если Вы делаете текст только в Ворде и не исправите ошибок выравнивания после ФР5/6/7, то при сохранении Вашего вордовского файла в TXT будет склейка/разделение абзацев!!!
     
      P.S. Ушел писать прогу преобразования сохраненного из ФР текста форматированного пробелами в правильный(!) текст, готовый к вставке в Ворд...


СООБЩЕНИЯ ЗА 24.09.2003
353. Zmiy, Минск (zmiy@inbox.ru) 16:18:06 [ответить]
      И опять о наших бар-ранах (о ФР7):
     
      Может этот ФР7 и распознает лучше на каких-то "внутренних тестах ABBYY" или стал лучше в каких-то применениях на PDFах, но все-таки он хуже ФР5 по сохранению оформления.
      Замечено следующее: если в ФР5 при сохранении в Word обычно используется выравнивание по ширине, то в ФР6/7 разработчики почему-то намудрили (наверное от слова "мудаки") и в тех же местах идет выравнивание влево, что я считаю вообще нонсенсом в DOC. Особенно это заметно на диалогах. Так еще ж в ФР6/7 появилось заполнение пробелами именно из-за того, что нужно же как-то растянуть строку, раз уж выравнивание влево... Два пробела подряд в файлах DOC - это тоже маразм!
      Если в ФР5 на тех местах, где шла склейка абзацев, идет выравнивание влево, то такие склейки легко находятся полуавтоматически, например, в Wordе. То на ФР6/7 эти же склейки не отличишь от нормальных ситуаций...
      У меня написана программа, которая из сохраненного в ФР специальным образом RTF файла, путем анализа этих самых выравниваний, делает текстовый файл с исправлениями склееных/разделенных абзацев. Так вот на ФР5 программа делает потрясающие результаты - в большинстве случаев после нее нет дополнительной правки абзацев. В то время как после ФР6/7 из-за таких заумностей, как выравнивание влево в нормальных абзацах, - делается много доисправлений...
     
      ...и я вернулся на ФР5.
     
      P.S. условный (для V.Yesaulovа): Если какая-то программа некорректно выполняет заявленные функции, то будете ли Вы покупать такую программу?


СООБЩЕНИЯ ЗА 21.09.2003
352. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 03:08:53 [ответить]
      > 351. V.Yesaulov.
      > > 350. Один из....
      > > Защита FR7 вскрыта...
      >
      > Плачет по вам ФБР. Горькими слезами! :)
     
      Фиг с ней, с фыбырой, она за бугром и до нее нам никаких дел нету. Действительные проблемы я вижу в другом. Их две. Первая. Из-за того, что программы и приложения платные, для общества в целом больше убытков, чем прибыли. Вторая. Хороший кряк ФР, в частности, - очень даже большая редкость. А сам по себе кряк как таковой - дело совершенно обычные, которое у сотен тысяч наших соотечественников никаких эмоций и вопросов вообще не вызывает. Поскольку сообщение о том, что крякнут 7-й ФР, я вопринимаю как пустой звук.


СООБЩЕНИЯ ЗА 19.09.2003
351. V.Yesaulov, Moskva (yes@zonus.ru) 13:32:38 [ответить]
      > 350. Один из....
      > Защита FR7 вскрыта...
     
      Плачет по вам ФБР. Горькими слезами! :)


350. Один из..., 13:19:42 [ответить]
      Защита FR7 вскрыта...


СООБЩЕНИЯ ЗА 18.09.2003
349. зТЙЗПТЙК, сТПУМБЧМШ 13:04:27 [ответить]
      > 345. bmn.
      > > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      > Не согласен. 5-й тоже придумывает преизрядно.
      Там это можно частично отключить, в большей степени, чем в шестом.


СООБЩЕНИЯ ЗА 14.09.2003
348. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:16:03 [ответить]
      Есть в сети книги типа ван Спэнкерен, история американской литературы (http://www.russian.rpo.at/pdf/ch1_lit.pdf>http://www.russian.rpo.at/pdf/ch1_lit.pdf), сделанные в pdf. В txt они корректно не конвертятся. Конвертация сама по себе достаточно простая, по принципу: латинская а соответствует русской ф, s - ы и т.д. Проблема в том, что после такой конвертации остается штук 5 русских букв, не имеющих соответствий в латинском наборе. Они обозначаются точками, и остается догадываться, какие это буквы на самом деле. Есть идеи для решения такой закавыки?


347. Артман, Волгоград (artman@mail.ru) 01:24:54 [ответить]
      Меня 5-й очень редко подводил, триал есть с каждым сканером, а если нужен кряк, то пишите - вышлю.


СООБЩЕНИЯ ЗА 13.09.2003
346. Bowline, Москва (bowline@mail.ru) 11:40:02 [ответить]
      > 343. Den.
      > > 340. Zmiy.
      > > > 339. Bowline.
      > > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      > >
      > > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
      >
      > А кряк под этот триал найти невозможно? Через тот же гугль?
     
      А может есть где не-трайал?


345. bmn, (bmn@lib.ru) 10:32:46 [ответить]
      > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      Не согласен. 5-й тоже придумывает преизрядно.


СООБЩЕНИЯ ЗА 12.09.2003
344. Григорий, Ярославль 15:17:20 [ответить]
      Касательно файнридера. Если речь идет о книгах, с их сложным языков и различными авторскими придумками, распознавать стоит не 6 и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с textshare, в том, что трудней именно эти придумки отлавливать, которые ворд не считает за ошибки.


СООБЩЕНИЯ ЗА 09.09.2003
343. Den, 19:54:42 [ответить]
      > 340. Zmiy.
      > > 339. Bowline.
      > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      >
      > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
     
      А кряк под этот триал найти невозможно? Через тот же гугль?


342. textshare, 15:33:10 [ответить]
      В пятницу купил лицензионный FineReader 7 Professional.
      У меня грустное впечатление: функциональных изменений я не усмотрел, только перешли от установки с ключевой дискетой на активизацию по сети или телефону с привязкой к железу компа.
     
      Ставишь программу, она выдает номер, который должен зависить от твоего железа. (В руководстве написано, что "небольшой" апгрейд его не изменит, а для нового компа нужна новая активация) Мне по телефону код активации выдали мгновенно. Причем с перерывом в час я FR поставил и на свой ноутбук, и без вопросов получил второй код активации (!). Интересно бы попробовать и в третий раз :-)
     
      Есть предварительное впечатление, что Змей прав, и они снизили уровень проверки и пометки неуверенно распознанных слов и знаков.
      FR, кажется, стал опасно самостоятелен в выборе вариантов: я 3-4 раза ловил его на том, что он при распознании заменил слово и даже его не пометил, как неуверенно распознанное.
     
      Устранен один маленький но неудобный баг (а может и не баг, а так,неосмотр) - изменение инструмента работы с изображением при переходе от страницы к странице. Например, если я прохожусь по всему пакету и чищу изображения от грязи, виньеток или колонтитулов, то каждый раз после переходп к изображению новой страницы приходилось заново выбирать ластик.
     
      Конец короткого абзаца по-прежнему в 20% случаев не определяется и переход к новой строки в конец не вставляется. Были еще какие-то впечатления, но всего не упомню, если интересно - спрашивайте.
     
      Общее впечатление: FR 7 - чисто маркетинговый ход, чтобы еще раз получить деньги с больших корпоративных клиентов за активацию в привязке к железу.


341. п я я я п╟я , п я я п╟п╫п╟ (nurshat@ok.kz) 14:20:48 [ответить]
      п я п╬я я п©п╬п╪п╬я я .
      п я п╬ п╪п╬п╤п╣я п©п╬п╢я п╨п╟п╥п╟я я пЁп╢п╣ п╪п╬п╤п╫п╬ п╫п╟п╧я пё пЁя п╟я пёя п╣я п╨пёп╧ пёп╫я п╣я я п╣п╧я п╢п╩я п п╢п╪пёп╫пёя я я пёя п╬п╡п╟п╫пёпё Informix-я п╟, пё п╨п╟п╨ п╪п╬п╤п╫п╬ п╣пЁп╬ я я я п╟п╫п╬п╡пёя я . п п╬п╤п╣я я п╟п╧я п©п╬п╢я п╨п╟п╤п╣я п╣. п п╩я я я пёп╣ я я п╩п╨пё пЁп╢п╣ п╪п╬п╤п╫п╬ п╠я п╢п╣я п©п╬я пёя п╟я я .
     
      п п╟я п╟п╫п╣п╣ п╠п╩п╟пЁп╬п╢п╟я п╣п╫


СООБЩЕНИЯ ЗА 08.09.2003
340. Zmiy, Минск (zmiy@inbox.ru) 10:09:39 [ответить]
      > 339. Bowline.
      > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
     
      www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...


339. Bowline, Москва (bowline@mail.ru) 07:32:03 [ответить]
      А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...


СООБЩЕНИЯ ЗА 07.09.2003
338. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:25:30 [ответить]
      Кста, а как быстро она пдф обрабатывает? (прошу указать притом частоту процессора и размер оперативки). Приблизительно, конечно.


СООБЩЕНИЯ ЗА 05.09.2003
337. Zmiy, Минск (zmiy@inbox.ru) 14:18:12 [ответить]
      > 336. Илья.
      > >> 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      >
      > Вот мерзавцы. Редкостные. Головная контора в Москве и нет русского языка в программе! К черту такой файнрыдр.
      > Буду пользоваться 4-м или поиу аналоги.
     
      Ну не надо уж так... ;)
      Нормальная (нетриальная) версия будет работать как нужно!
      А тем более достойных аналогов у ФР нету! Лучше уж в ФР мучаться, чем чем-то похуже... ;)
     
      Я вот продолжил тестирование ФР7.
     
      Взял ну очень плохо отсканированный TIFF (светлый - с недостатком яркости)...
      Распознал в ФР6 и ФР7 и не заметил, чтобы качество распознавания было другим! И там и там одинаковые ошибки! Где в ФР6 не распознавало, там же и ФР7 не распознает...
      Конечно, как я уже говорил ниже :), за счет того что некоторые "неуверенности" теперь не показываются, то да - качество получше... Но по-моему это чисто надуманное улучшение качества. Раньше, к примеру, все без исключения "неуверенности" показывались, а теперь достаточно во внутреннем словаре ФР найти неуверенное слово и сделать вывод, что неуверенности нет - слово же "человеческое" распозналось;). Не говоря уж о том, что в ФР5/6 "неуверенными" были даже пробелы!
      Поэтому те, кто после распознавания сразу сохранял текст и вычитывал в других редакторах, - для тех ничего не улучшится!
      Те же, кто после распознавания, проверял текст в самом ФР, тому конечно улучшение будет заметно! Скорость такой проверки будет повыше...
     
      Забавно другое - в каждой новой версии разработчики уверяют нас, что качество улучшилось на ...дцать процентов... Это если сложить все эти проценты получиться ж ох какая сумма - процентов 100 относительно, например, ФР4. ;) Но такого уж глобального улучшения, по крайней мере, я Н Е В И Ж У !!!
      Какие же это "внутренние тесты компании" проходит ФР, если в реальной работе больших улучшений не заметно...
     
      P.S. Я тут, конечно, не рассматриваю новинки в ФР6/7 типа распознавания PDF... Я тестировал только те функции, которые применяются при сканировании книг!


СООБЩЕНИЯ ЗА 04.09.2003
336. Илья, Таллин 22:03:33 [ответить]
      > > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
     
      Вот мерзавцы. Редкостные. Головная контора в Москве и нет русского языка в программе! К черту такой файнрыдр.
      Буду пользоваться 4-м или поиу аналоги.


335. KpucmuHa, Mekcuko (crisarb@yahoo.com) 20:56:35 [ответить]
      Hola


334. Zmiy, Минск (zmiy@inbox.ru) 17:05:11 [ответить]
      > 333. PDF-Library.
      > > 332. Zmiy.
      > > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      >
      > Привет, Змиюга!
      >
      > Это как так понимать??? Я работаю под немецким Windows, где русская версия FR никогда не идет, даже под Win-ХР. Значит ли это, что теперь я не могу либо Win, либо FR-7 использовать?
     
      FR7 - Справка - Справка - Активация -
     
     
      Компания ABBYY принимает меры по борьбе с компьютерным пиратством и защите прав на интеллектуальную собственность. Пиратство причиняет ущерб не только производителям программного обеспечения, но и конечным пользователям. Приобретая лицензионные продукты, пользователи получают программные продукты без каких-либо изменений, сделанных третьими лицами, в то время как пиратские продукты не могут гарантировать этого.
     

     
      . . .
     
     
      В зависимости от версии продукта и территории его распространения, возможны следующие ограничения по функциональности:
     
      Невозможность сохранения и печати распознанного текста на языках с кириллическим алфавитом (ABBYY FineReader 7.0 Professional Edition);
      Невозможность сохранения и печати распознанного текста на всех поддерживаемых языках (ABBYY FineReader 7.0 Professional Edition);
      Версия ABBYY FineReader 7.0 Corporate Edition без активации не работает.
     


333. PDF-Library, Augsburg, Germany (info@imwerden.de) 14:45:29 [ответить]
      > 332. Zmiy.
      > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
     
      Привет, Змиюга!
     
      Это как так понимать??? Я работаю под немецким Windows, где русская версия FR никогда не идет, даже под Win-ХР. Значит ли это, что теперь я не могу либо Win, либо FR-7 использовать?


332. Zmiy, Минск (zmiy@inbox.ru) 12:28:02 [ответить]
     
      Информация :
     
      Вышел FineReader 7.0 : http://www.abbyy.ru/press_release.asp?param=28667>http://www.abbyy.ru/press_release.asp?param=28667
     
      Скачал англ.триал, установил, проверил, докладаю :
     
      1) доп.языки скачиваются с интернета
      2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      3) по распознаванию - объективно не улучшилась, субъективно улучшилась из-за того, что там где ФР5/6 показывал неуверенности типа "неуверенно распознанные символы", то ФР7 уже не показывает...
      Судя по всему "качество" они улучшили как раз за счет того, что не показывают некоторые "неуверенности"...
      Нужно проверить качество на очень плохо отсканированном тексте...
      4) по сохранению оформления - не улучшилось - как ФР5/6 неправильно определял абзацы, так и ФР7 неправильно определяет...
      Я надеялся что в ФР7 они над этим поработают и сделают так как было в ФР4, где оформление правильно воссоздается (по крайней мере разбиение на абзацы), но оказалось, что я размечтался...
     
      Проверка производилась по тем же тестовым TIFFам - http://zpdd.chat.ru/files/test-tif.rar>http://zpdd.chat.ru/files/test-tif.rar
      Сравнение оформления у ФР4/5/6 - http://zpdd.chat.ru/files/test-txt.rar>http://zpdd.chat.ru/files/test-txt.rar
     
      Вывод : Можно переходить на ФР7 !
     
      P.S. Кто-нибудь - также протестируйте ФР7 и скажите результаты ваших тестов...


СООБЩЕНИЯ ЗА 03.09.2003
331. Павел, Самара (afpavel@yandex.ru) 22:05:17 [ответить]
      Мужики, возникла проблема! Помоги кто может!
      Установил Fine Reader 6, несколько месяцев работало всё нормально, но потом почему то, полетела функция сохранения результатов сканирования, при попытке сохранить отсканированный текст в Worde или в буфере обмена программа выдает внутреннюю програмную ошибку и пишет: D:\Fine Reader6\.\FineObjects\Inc\Errors.h, 150. Такого адреса не существует, программа и дистрибутив находятся на диске C:\. Пробовал переустанавливать,чистил реестр, удалял всё связанное с OCR, вновь переустанавливал - ничего не помогает. Может кто-нибудь знает в чём дело, буду очень признателен.


330. Zmiy, Минск (zmiy@inbox.ru) 09:58:40 [ответить]
      Вопрос:
      Отзовитесь у кого сканер Umax Astra 4700 ???
      В частности интересует версия драйвера и ПЗУ (I/O) (смотреть в twainе - справа вверху кнопочка есть - информация).
      А то что-то меня мой смущает - разные драйвера по-разному себя ведут...


СООБЩЕНИЯ ЗА 02.09.2003
329. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:48:55 [ответить]
      обновлений. Считай, что это попытка усовершенствования файл-эхи FIDO, самым главным недостатком которой является ущербность сопровождения произведения и поддержка морально устаревших TXT-файлов.
     
      Идея эхоконференции фидо fileecho на самом деле существенно другая. Проще всего, если знаешь имя нужного файла. Искалка на клиенте по твоему запросу пробежит по бибиэскам и пришлет справку о том, где искомое есть. Она может также бегать и по file_id.diz-файлам, т.е. присылать справки по введенным в них описаниям. Но тут особенная "точность" нужна. Если это какая-нибудь программа, то ошибиться очень тяжело. А если описание книги, где может быть автором Хоторн или Готорн, Донливи или Данливи? Часто пишется двояко, кроме того, библиотекари часто элементарно вопиюще неграмотны, даже и не знают того, что на самом деле в их библиотеках есть. Встречаются даже описания типа "Про войну без автора", или догадайся, мол сама... :-(


СООБЩЕНИЯ ЗА 01.09.2003
328. andy, НПУЛЧБ (andy@zhilcredit.ru) 17:29:44 [ответить]
      > Спасибо


327. Andrej, Ekaterinburg (tverjakov@mail.ru) 17:04:25 [ответить]
      > 326. andy.
      > кто-нибудь знает что случилось с Фензином (www.fenzin.org)?
     
      Snake пообещал, что откроются 11-12 сентября:
     
      http://www.bomanuar.ru/forum/viewtopic.php?p=2100&sid=b3edf35343fe8e153bf80256c7400fb2>http://www.bomanuar.ru/forum/viewtopic.php?p=2100&sid=b3edf35343fe8e153bf80256c7400fb2


326. andy, москва (andy@zhilcredit.ru) 16:29:01 [ответить]
      кто-нибудь знает что случилось с Фензином (www.fenzin.org)?


325. Sokolov, N.Novgorod 08:14:38 [ответить]
      > 323. Вячеслав Сачков.
      > > 322. Sokolov.
      > И Вас я, к сожалению, обломать вынужден. Это только иллюзия такая ламерская, что сетевые библиотеки существуют долго. На самом деле большинство их живет всего по паре лет и даже меньше. Для меня нет большего огорчения, когда какая-нибудь прелестная библиотека, например, "Словесник" или "Симпад", пропадает. И происходит это гораздо чаще, чем мне хотелось бы предполагать. Что успел скачать, когда они были, то у меня отложилось. А что не успел, то пропало совсем навсегда. Поэтому предлагаемое Вами сочленение вживую не выручит. Я это знаю наверняка. Выручить могут огромные офлайновые коллекции, как, например, у меня и у тезки моего Алексеева, однако офлайн есть офлайн... :-(
     
      А это как раз и предлагается для решения подобных проблем. Некий клиент будет предназначен для автоматического обновления в основном мощных оффлайновых коллекций, их которых-то и составляются сетевые библиотеки. По сути дела предлагается в десятки раз увеличить их количество, создать систему их согласованного обновления. Пускай может исчезнуть проект, в едином пространстве библиотек файл останется навсегда, даже за очень короткое время он успеет разойтись по десяткам и сотням библиотек, вот только времени на доступ к нему необходимо больше. В этом случае необходимо настроить только систему выборки из общего потока, загрузка будет идти самим клиентом. Создание/реставрация новых сетевых библиотек на базе выборки из единого каталога будет происходить очень быстро. Один владелец действительно не сможет выполнить это быстро, а если монтаж будет идти из нескольких десятков центров (причем без непосредственного участия владельцев, cgi-скриптами)? Клиент центрального каталога будет опрашивать сначала online-, а при временном отсутствии в их базах произведений, и offline-библиотеки при их временной регистрации для получения обновлений. Считай, что это попытка усовершенствования файл-эхи FIDO, самым главным недостатком которой является ущербность сопровождения произведения и поддержка морально устаревших TXT-файлов.


324. Andrej, Ekaterinburg (tverjakov@mail.ru) 03:05:53 [ответить]
     
      Кое-что из исчезнувших библиотек (в частности того же www.slovesnik.ru) можно найти в архиве www.archive.org (правда, только html, но не запакованные файлы, к сожалению).
     
      Поэтому, большая просьба ко всем, кто у себя на сайтах ставит ссылки на другие ресурсы: не убирайте ни в коем случае недействительные ссылки, просто помечайте их как устаревшие!
     
      Даже если сайта уже нет, или материал с него убран - это еще не значит, что он безвозвратно пропал. Зная бывший адрес его часто еще можно выцарапать из кеша Гугля или Апорта, а также из вышеназванного веб-архива!


323. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 00:11:44 [ответить]
      > 322. Sokolov.
      > В свете только что прочитанных сообщений актуальным выглядит вопрос создания единого каталога электронных библиотек, в котором должны регистрироваться все отсканированные любителями-OCR-щиками произведения. Система должна состоять из трех уровней: единый каталог, бесплатные online- и offline- (с периодическим подключением) электронные библиотеки (к ним относятся и OCR-щики) и собственно читатели. В этом случае
     
      И Вас я, к сожалению, обломать вынужден. Это только иллюзия такая ламерская, что сетевые библиотеки существуют долго. На самом деле большинство их живет всего по паре лет и даже меньше. Для меня нет большего огорчения, когда какая-нибудь прелестная библиотека, например, "Словесник" или "Симпад", пропадает. И происходит это гораздо чаще, чем мне хотелось бы предполагать. Что успел скачать, когда они были, то у меня отложилось. А что не успел, то пропало совсем навсегда. Поэтому предлагаемое Вами сочленение вживую не выручит. Я это знаю наверняка. Выручить могут огромные офлайновые коллекции, как, например, у меня и у тезки моего Алексеева, однако офлайн есть офлайн... :-(


СООБЩЕНИЯ ЗА 31.08.2003
322. Sokolov, N.Novgorod 20:21:18 [ответить]
      В свете только что прочитанных сообщений актуальным выглядит вопрос создания единого каталога электронных библиотек, в котором должны регистрироваться все отсканированные любителями-OCR-щиками произведения. Система должна состоять из трех уровней: единый каталог, бесплатные online- и offline- (с периодическим подключением) электронные библиотеки (к ним относятся и OCR-щики) и собственно читатели. В этом случае запрошенное читателем из единого каталога произведение может быть им получено, пока существует набор библиотек с разрешенной владельцами бесплатной отправкой книг.
      Фактически любая, даже самая раскрученная библиотека, должна стать одной из множества ей подобных...
      Единый каталог может также решить проблему согласованного обновления фондов (исправления плохо вычитанных произведений). Также он может позволить решить спорные вопросы с принципами подготовки произведений к размещению в сети (предполагается, что будут регистрироваться все форматы: TXT, RTF, DOC, PDF, HTML и пр. и пр.).
      В дальнейшем обязателен переход на одноуровневую систему (аналог пиринговой сети).


321. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 05:48:15 [ответить]
      > Да нет там никаких фактов. Журналистский треп про ужасных хакеров-пиратов. Безмозглая статья. Не обращайте внимания. Даже если и будут платные библиотеки, ими почти никто не будет пользоваться. Очевидно, что будет альтернатива. Разные современные письменники будут пытаться "заработать в Сети". На здоровье, я их не читаю. "Авторское право" имеет срок в "50 лет после смерти автора". То есть "классика" здесь не при чем, нет никаких юридических обоснования для запрещения выкладывания старой литературы. Дж.Конрад которого я (злодей, пират и варвар) сейчас сканирую (то есть происходит "грабеж среди бела дня")умер в 1924-м году, никакое авторское право на его книги уже не распространяется.
     
      Да нет. Все именно так и будет, как утверждается, а не так, как Вы считаете. Объясню, почему. Колоссальное большинство пользователей сети - даже не ламеры, а, я извиняюсь, тупые бараны, совершенно не умеющие ничего находить и совершенно не представляющие того, как это делать. Причем доля баранов в общем числе пользователей сильно увеличивается буквально с каждым днем. Соответственно увеличивается и число вебмастеров, желающих заработать на этом деньги. Так, еще год назад виртуальных книжных магазинов было раз-два и обчелся. Сейчас их количество увеличилось минимум на порядок. Далее. Год назад уже имелись платные электронные библиотеки, но они существовали в качестве курьезных раритетов, затей глупых чудаков. Сейчас и такого добра стало значительно больше. На выходе получаем следующую картину. Чайник тупой хочет, например, "Die Leiden des jungen Werthers" на русском языке найти. Тычет в яндекс и на первых десяти страницах ответа получает ссылки на сайты книжных магазинов, на следующей паре страниц - ссылки на платные виртуальные книгохранилища. И где-то на 14-й странице приблизительно он найдет ссылки на бесплатные файлы. Причем в большинстве своем это будут ссылки дохлые или криво прописанные, неоткрывающиеся. А из тех версий сканинга (допустим, трех-четырех), которые товарищ найдет и бесплатно скачает, большинство будет не вычитано совсем или вычитано, извиняюсь, через задницу. Или еще в формате какого-нибудь экзотического ридера, скачивать и устанавливать который надо три дня и еще пять дней на то терять, чтобы с ним освоиться. Нет, чайник тупой таких гигантских усилий затрачивать не станет. Ему же ведь еще надо объяснить, что книги из сети в подавляющем большинстве своем бесплатно качаются. А большинство баранов безмозглых этой великой премудрости просто вообще не знает. Скачает за деньги по первой попавшейся ссылке и все, будет счастливо... :-(


320. Ilja, 00:46:02 [ответить]
      См. http://www.livejournal.com/users/utkasmerti/>http://www.livejournal.com/users/utkasmerti/ , частично там есть и "ответы".
     
      > Книги не могут быть "freeware", copyleft по определению - первое относится только к программному обеспечению и призвано снять с производителя всякую ответственность за неправильную роботу программы, а второе может быть использовано только самим автором.>
      Это совершенно очевидно. Я имею ввиду идеологию свободного использования (где фривэр и копилефт только частные примеры). О чем уже было много написано, в частности здесь: http://www.hot.ee/utkasmerti/more/declaration.htm>http://www.hot.ee/utkasmerti/more/declaration.htm , и здесь
      http://imperium.lenin.ru/LENIN/32/C/>http://imperium.lenin.ru/LENIN/32/C/
     
      > Вам сам Толстой сказал, что его книги можно распространять как copyleft?>
      Чудесный аргумент, что и говорить. Если такие аргументы(некорректные, я хочу сказать), то мой ответ: Да, сам сказал!
      Кстати, если уж о Толстом, то он от прав на свои произведения отказывался, это общеизвестно.
     
      > >Так вот там предлагают платный доступ к "Поэтическому сборнику" Гумилева, "Страданиям молодого Вертера" Гете, К произведениям Байрона, Пастернака, Шекспира.>>
     
      Что взять с платных мерзавцев? Плюньте и забудьте. Дураки люди.
     
      > О качестве статьи: мне важны изложенные в ней факты.>
      Да нет там никаких фактов. Журналистский треп про ужасных хакеров-пиратов. Безмозглая статья. Не обращайте внимания. Даже если и будут платные библиотеки, ими почти никто не будет пользоваться. Очевидно, что будет альтернатива. Разные современные письменники будут пытаться "заработать в Сети". На здоровье, я их не читаю. "Авторское право" имеет срок в "50 лет после смерти автора". То есть "классика" здесь не при чем, нет никаких юридических обоснования для запрещения выкладывания старой литературы. Дж.Конрад которого я (злодей, пират и варвар) сейчас сканирую (то есть происходит "грабеж среди бела дня")умер в 1924-м году, никакое авторское право на его книги уже не распространяется.
      Еще раз говорю, статья дурацкая (штампы, мифы, недодуманный фарш), трепло, обращать на нее внимания не имеет смысла. За ссылку спасибо.


СООБЩЕНИЯ ЗА 30.08.2003
319. Халява кончилась!!!, 18:43:08 [ответить]
      > 317. Илья Васильев.
      > 1. Само слово "халява" довольно-таки отвратительно. Так что прекрасно, если эта гадость на самом деле умрёт. Есть "freeware", copyleft, свободное пользование и т.д. А есть "халява". Прошу такие вещи не путать.
     
      Чем вам не понравилось слово "халява"?
      Книги не могут быть "freeware", copyleft по определению - первое относится только к программному обеспечению и призвано снять с производителя всякую ответственность за неправильную роботу программы, а второе может быть использовано только самим автором. Вам сам Толстой сказал, что его книги можно распространять как copyleft?
      Само слово "халява" как раз и подразумевает свободное пользование. Звучит мерзко, согласен, но и что с того?
     
      > 2. Вы должно быть хотели сказать, что больше нельзя будет пользоваться библиотекой Мошкова бесплатно? Это не так, перечитайте статью еще раз. Речь идет о другом, а именно о том, что ряд современных издательств и авторов будут открывать (а ля Стивен Кинг) сайты, где можно будет прочесть книги за деньги.
     
      Прочитайте внимательно отрывок из статьи на форуме. Там сказано "В самое ближайшее время там (то есть на либ.ру) будет запущена коммерческая библиотека, за скачивание книги придется платить."
      Относительно авторов: это уже не новость. Новость - это создание универсальных библиотек по типу библиотеки Мошкова, только платных.
     
      > Что библиотеки Мошкова "не отменяет" вообще-то. Какие еще деньги за Илиаду, Шекспира, Толстого, вы сами подумайте? Никакое "авторское право" в отношении "старых" авторов (вплоть до середины 20-го века) вообще уже не существует.
     
      Хочу обратить ваше внимание на ресурс www.vip.km.ru. Его уже ругали на этом форуме, но я не об этом. Так вот там предлагают платный доступ к "Поэтическому сборнику" Гумилева, "Страданиям молодого Вертера" Гете, К произведениям Байрона, Пастернака, Шекспира... Это ли не классика?
     
      > Глупые и наивные издатели просто надеются, что круутой рассиский детектив, пелевин-сорокин и лукьяненко будут покупаться и в Сети. То есть по большей части разный скоропортящийся товар.
      > Вы бы стали платить? Я не стал бы, лучше книгу купить.
     
      Не стал бы. Но я еще раз говорю меня мало интересует что там один отдельно взятый автор напишет. Меня интересует, что будет с библиотекой Мошкова?
     
      О качестве статьи: мне важны изложенные в ней факты. Я не филолог, чтобы осуждать стили, тональности и т.п.


318. aLex, 16:44:03 [ответить]
      Маленькая цитата из статьи: "Особо пострадавший от Интернета фантаст Сергей Лукьяненко сказал "Итогам":..." Это Лукьяненко-то, сделавший себе имя на прочтенном всем интернетом файле "Лабиринт отражений" - самый пострадавший?
      И так - каждый абзац. Смесь изрядной некомпетентности в теме одного журналиста со вбитой намертво в голову политкорректностью другого.
     
      В свете вышесказанного - относиться к словам, касающимся Мошкова, всерьез - явно преждевременно. Думаю, Максим не замедлит сообщить пропорцию истины и бреда в цитированном абзаце...


317. Илья Васильев, 15:25:02 [ответить]
      1. Само слово "халява" довольно-таки отвратительно. Так что прекрасно, если эта гадость на самом деле умрёт. Есть "freeware", copyleft, свободное пользование и т.д. А есть "халява". Прошу такие вещи не путать.
      2. Вы должно быть хотели сказать, что больше нельзя будет пользоваться библиотекой Мошкова бесплатно? Это не так, перечитайте статью еще раз. Речь идет о другом, а именно о том, что ряд современных издательств и авторов будут открывать (а ля Стивен Кинг) сайты, где можно будет прочесть книги за деньги.
      Что библиотеки Мошкова "не отменяет" вообще-то. Какие еще деньги за Илиаду, Шекспира, Толстого, вы сами подумайте? Никакое "авторское право" в отношении "старых" авторов (вплоть до середины 20-го века) вообще уже не существует.
      Глупые и наивные издатели просто надеются, что круутой рассиский детектив, пелевин-сорокин и лукьяненко будут покупаться и в Сети. То есть по большей части разный скоропортящийся товар.
      Вы бы стали платить? Я не стал бы, лучше книгу купить.
     
      3. Статья совершенно дурацкая (а местами просто мерзкая), к слову. Обычный истероидный журнализм: "книгопечатанию приходит конец!", не обращайте внимания. Якобы книги больше не будут покупать. Такую глупость могли сказать только журналисты.
      Журналист=дебил. (~75%)


316. Халява кончилась!!!!, 04:17:53 [ответить]
     
      http://www.itogi.ru/paper2003.nsf/Article/Itogi_2003_07_29_13_3630.html>http://www.itogi.ru/paper2003.nsf/Article/Itogi_2003_07_29_13_3630.html
      Тот же г-н Мошков явно не зря почти 10 лет "раскручивал" сайт и содержал его за свой счет (хотя хостинг и трафик у него бесплатные: для провайдера наличие столь популярного ресурса Сети само по себе является хорошей рекламой). В самое ближайшее время там будет запущена коммерческая библиотека, за скачивание книги придется платить. "Через 10 лет возникнет большой рынок электронных книг, и тот, кто заранее к этому подготовился, на нем и преуспеет. Я намерен заняться этим уже сейчас. Нужно начинать привлекать авторов, но, естественно, они должны понимать, что их заработок на начальном этапе будет просто мизерным. В первые годы в Интернете автор заработает всего несколько долларов, через 10 лет уже несколько сотен долларов в год, а там дальше поглядим..." - говорит г-н Мошков.
     
      Халява кончилась!!!! Жаль...


315. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:15:06 [ответить]
      > 314. Илья Васильев.
      > А на www.gramota.ru в разделе словарей случайно не было Ожегова?
     
      С вызовом по одному слову. Это-то не проблема. Такого добра везде завались. А чтобы целыми корпусами, хотя бы по начальным буквам, да еще вычитанно, да еще с ударениями и другими важными знаками, имеющимися в тексте, но не воспроизводящямися в txt, - такого нигде нет. И здесь тоже. Чем и недоволен народ. Ведь если знаешь, как правильно слово для запроса набирать, то и смотреть его в словаре нужды особой нету. На то и словарь, чтобы легко снимать все подобные вопросы...


СООБЩЕНИЯ ЗА 29.08.2003
314. Илья Васильев, 21:47:37 [ответить]
      А на www.gramota.ru в разделе словарей случайно не было Ожегова?


313. Сергей, Н.Архыз (satr@sao.ru) 14:31:14 [ответить]
      Всем привет!
     
      Меня тоже заинтересовала электронная версия словаря Ожегова.
      Скачал, пытался написать искалку, но сразу увидел, что
      словарь не вычитан и кое-где не отформатирован.
      Потратил несколько вечеров и исправил основное - рус/анг,
      разделение словарных статей и как справедливо отмечено
      море ошибок (!). Теперь по крайней мере словарь работает для
      простой искалки. (текст на С могу прислать заинтересованным)
     
      Но я далек от мысли, что исправлено все -- нужно вычитывать
      и даже сравнивать с оригиналом.
     
      Посылаю мой вариант Максиму в надежде на новых волонтеров.
     
      ===Сергей.


СООБЩЕНИЯ ЗА 23.08.2003
312. Dima, 23:00:45 [ответить]
      > 311. Bowline.
      > У меня вопрос, возможно, наивный. Что такое Palm (кроме того, что это устройство для чтения)? Спасибо.
     
      Palm - карманный компьютер.
      http://www.yandex.ru/yandsearch?text=palm>http://www.yandex.ru/yandsearch?text=palm


311. Bowline, Москва (bowline@mail.ru) 07:50:11 [ответить]
      У меня вопрос, возможно, наивный. Что такое Palm (кроме того, что это устройство для чтения)? Спасибо.


СООБЩЕНИЯ ЗА 21.08.2003
310. PDF-Library, Augsburg, Germany (info@imwerden.de) 12:31:23 [ответить]
      > 309. п п╩я я п п╟я пёп╩я п╣п╡.
      > п я п╬я я п╠п╟ п╨п╬ п╡я п╣п╪ я п╟п╠п╬я п╫пёп╨п╟п╪ я п╨п╟п╫п╣я п╟ пё п╠я п╪п╟пЁпё: п╫п╣ п©п╬п╩я п╥я п╧я п╣я я п╡я я я пёп╪ PDF-п╬п╪! п п╬п╪пёп╪п╬ я п╟п╥п╫я я п╫п╣я п╢п╬п╠я я п╡, я я п╬ п©я пёп╨п╟п╤п╣я п╣ п╢п╣п╩п╟я я я я я пёп╪пё я п╣п╨я я п╟п╪пё, п╣я п╩пё я п╬я п╪п╟я п©п╢я п©п╬п╪я e?
     
      txt pomre!!!


СООБЩЕНИЯ ЗА 20.08.2003
309. Илья Васильев, 23:21:20 [ответить]
      Просьба ко всем работникам сканера и бумаги: не пользуйтесь вы этим PDF-ом! Помимо разных неудобств, что прикажете делать с этими текстами, если формат пдф помре?


СООБЩЕНИЯ ЗА 19.08.2003
308. Zmiy, Минск (zmiy@inbox.ru) 17:47:23 [ответить]
      > 307. Вячеслав Сачков.
      > > 306. Zmiy.
      >
      > > Выложили "Толковый словарь" Ожегова - но почему он не вычитан!? Им же невозможно пользоваться - море ошибок... Это же
      >
      > В бумажно-оригинальном словаре имеются знаки ударения, невоспроизводимые в формате win-txt. В данном случае это крайне важно. В rtf или ему подобном формате сохранять надо было.
     
      Я не про ударения говорил, а про невычитанность - мусор сплошной...


307. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:46:08 [ответить]
      > 306. Zmiy.
     
      > Выложили "Толковый словарь" Ожегова - но почему он не вычитан!? Им же невозможно пользоваться - море ошибок... Это же
     
      В бумажно-оригинальном словаре имеются знаки ударения, невоспроизводимые в формате win-txt. В данном случае это крайне важно. В rtf или ему подобном формате сохранять надо было.


СООБЩЕНИЯ ЗА 18.08.2003
306. Zmiy, Минск (zmiy@inbox.ru) 00:33:37 [ответить]
      Хотелось бы обратиться с требованием к OCRщикам :
     
      ВЫЧИТЫВАЙТЕ ПРИСЫЛАЕМЫЕ СЮДА ТЕКСТЫ !!!
      НЕ ЗАПОЛНЯЙТЕ ИНТЕРНЕТ НЕВЫЧИТАННЫМИ ТЕКСТАМИ!!!
     
      Вычитывайте хотя бы в самом FineReadere...
      А то lib.ru превращается в svalka.ru - свалка невычитанных текстов...
      Выложили "Толковый словарь" Ожегова - но почему он не вычитан!? Им же невозможно пользоваться - море ошибок... Это же неуважение к читателям!..
      Тоже относится к произведениям Тургенева...
      На каждый второй текст здесь нужно ставить клеймо : НЕ ВЫЧИТАНО!!!
      Ну нельзя же так...
      Да и в некоторых других библиотеках стремятся выложить побольше книг, не заботясь о вычитке... Это относится в частности к А.Бурцеву с fantast2.narod.ru.
      И товарищи, конвертирующие книги во всякие PDF и др., лучше бы тратили большее время на вычитку...


СООБЩЕНИЯ ЗА 16.08.2003
305. Zmiy, Минск (zmiy@inbox.ru) 00:52:36 [ответить]
      > 304. 13╟.
      > > Это полная фигня. Например, автозамена в ней заменяет при наличии нескольких вариантов первым словом из списка вариантов замен. Исправляя ошибки, она добавляет свои собственные... Могёт, в Professional, где рекламируется возможность использовать собственные правила замены, она и хороша. Но сие-то как раз и реализуется в макросах!
      >
      >
      > я не об этом. может она и плохо исправляет, но то как она умеет форматировать текст из дебильного DOS-форматного текста в нормальный отформатированный текст.
      > под нормальным я имею ввиду такой текст который вписывается в любую ширину окна и в котором всего один перевод каретки на абзац. т.е. строки длиной в абзац.
      > вот это она прекрасно делает.
      > еще она убирает всякие там лишние двойные пробелы, двойные пустые строки и очищает текст от знаков переноса.
     
      Ну, товарисч, зачем же Вы так... Если Вы привыкли читать такие тексты, то Вам поможет набор утилит от Леонида Каганова :
      http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm
      и в частности утилита PREWORD.COM:
     
      PREWORD.COM - подготовка текста DOS ко вставке в Winword. Убирает лишние
      пробелы между словами, снимает переносы слов, выравнивает
      абзац в одну длинную строку, как любит Winword, переводит в
      кодировку WIN. Остается только загрузить полученный текст в
      WinWord, установить по вкусу шрифт, отступы и стиль
      выравнивания, после чего можно любоваться или печатать.
     

     
      Всем же не угодишь! Не будут же OCRщики предоставлять тексты во всех возможных вариантах... Кому как удобнее... Вот мне, например, удобнее выкладывать именно в TXT, хотя я и предоставляю альтернативу в виде DOC...


СООБЩЕНИЯ ЗА 15.08.2003
304. 13╟, (q13@bk.ru) 17:29:30 [ответить]
      > Это полная фигня. Например, автозамена в ней заменяет при наличии нескольких вариантов первым словом из списка вариантов замен. Исправляя ошибки, она добавляет свои собственные... Могёт, в Professional, где рекламируется возможность использовать собственные правила замены, она и хороша. Но сие-то как раз и реализуется в макросах!
     
     
      я не об этом. может она и плохо исправляет, но то как она умеет форматировать текст из дебильного DOS-форматного текста в нормальный отформатированный текст.
      под нормальным я имею ввиду такой текст который вписывается в любую ширину окна и в котором всего один перевод каретки на абзац. т.е. строки длиной в абзац.
      вот это она прекрасно делает.
      еще она убирает всякие там лишние двойные пробелы, двойные пустые строки и очищает текст от знаков переноса.


СООБЩЕНИЯ ЗА 14.08.2003
303. Sokolov, N.Novgorod (sokolov_av@pochtamt.ru) 08:02:58 [ответить]
      > 301. 13╟.
      > в результате долгих поисков нашлась программа которая форматирует текст, убирает концы строк, переносы стирает и много чего еще. все эти макросы для ворда - фигня.
      > называется AfterScan Express
      > http://www.afterscan.com>http://www.afterscan.com
     
      Это полная фигня. Например, автозамена в ней заменяет при наличии нескольких вариантов первым словом из списка вариантов замен. Исправляя ошибки, она добавляет свои собственные... Могёт, в Professional, где рекламируется возможность использовать собственные правила замены, она и хороша. Но сие-то как раз и реализуется в макросах!


СООБЩЕНИЯ ЗА 13.08.2003
302. Zmiy, Минск (zmiy@inbox.ru) 23:26:13 [ответить]
      > 301. 13╟.
      > может не по теме, но для того чтобы отсканированные тексты было удобно читать и потом распечатывать:
      >
      > в результате долгих поисков нашлась программа которая форматирует текст, убирает концы строк, переносы стирает и много чего еще. все эти макросы для ворда - фигня.
      > называется AfterScan Express
      > http://www.afterscan.com>http://www.afterscan.com
      >
      > она типа платная, но работет нормально с кряком. кряков полно, надо только поискать.
      > короче, те кто сканирует, используйте эту штуку чтобы удобнее было читать.
      > не сочтите это за рекламу. хотя рекламировать ее стоило бы.
      >
      > с искр. уваж. 13╟
     
     
      А мы эту программу давно уже видели...
      А Вы её запускали? Вы ею пользовались!? Или только прочитали описание?
      Она слишком умная - делает то, что считает нужным... И не всегда коррекстно... Это неправильно!
     
      Что значит "чтобы было удобно читать и потом распечатывать"? Уточните пожалуйста...


301. 13╟, (q13@bk.ru) 19:28:26 [ответить]
      может не по теме, но для того чтобы отсканированные тексты было удобно читать и потом распечатывать:
     
      в результате долгих поисков нашлась программа которая форматирует текст, убирает концы строк, переносы стирает и много чего еще. все эти макросы для ворда - фигня.
      называется AfterScan Express
      http://www.afterscan.com>http://www.afterscan.com
     
      она типа платная, но работет нормально с кряком. кряков полно, надо только поискать.
      короче, те кто сканирует, используйте эту штуку чтобы удобнее было читать.
      не сочтите это за рекламу. хотя рекламировать ее стоило бы.
     
      с искр. уваж. 13╟


Continue