Список форумов |  Добавить сообщение |  Правила |  11.09.2025, четверг, 23:13:34
СПИСОК ФОРУМОВ
11.09.2025
23:00 Главная гостевая книга библиотеки(5857)
09:07 Обо всем - мнения(3149)
06.09.2025
15:23 "Разыскивается песня", доска объявлений(5441)
02.09.2025
12:08 "Разыскиваются книжки", доска объявлений(15508)
10:11 Проблемы OCR и электронных библиотек(1973)
16.08.2025
07:39 Книжки, которые скоро будут выложены(56)
02.05.2025
21:25 О возвышенной поэзии(1593)
24.02.2025
13:09 Книжки, которые стоит прочитать(5230)
13:05 Водный и всякий туризм(87)
22.02.2025
06:11 Русские впечатления о заграничной жизни(9443)
05:34 Мнения читателей о дизайне библиотеки(1479)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 19.03.2003
188. test, test (test) 13:05:28 [ответить]
      test


186. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:47:23 [ответить]
      В дополнение к прошлой мессаге. Собственно, никакой своей изюминки на КМ вообще нет. Ловили бы лохов любителей чейзов и акуниных - небольшая проблема. Но меня заинтересовала там позиция "Человек в поисках смысла" Виктора Франкла. Судя по заявленному объему, эта книга там полностью. А на деле ссылка тухлая. То ли файл порченый, то ли его вообще нет. Представим себе теперь человека, которому эта книга действительно нужна. Он платит 10 баков, а ему будут лапшу на уши вешать до бесконечности. Что это? Жульничество, по-моему, самое очевидное, однозначно.


СООБЩЕНИЯ ЗА 17.03.2003
185. Leon, (ldnleon@yandex.ru) 15:40:39 [ответить]
      > 184. PDF-Library.
      > > 180. А.Бурцев.
      >
      Как правило, текст содержит кучу ошибок, поэтому писать, что "выверял такой-то" у меня рука не поднимается. Исключение, я сделал pdf из двухтомника Андроникова и написал, что отсканировано и вычитано Leon' ом, поскольку я его не вычитывал, а в тексте море ошибок - я снял с себя ответственность за качество текста.
     
     
      ldn-knigi: ответ PDF-Library
      - К вопросу об Андроникове: неясно для нас, где вы это "море" нашли? Все тексты, которые нами даются на странице, мы сверяем по крайней мере два раза, и с ОРИГИНАЛА. Так что, к чему это голословное утверждение? И какое отношение это имеет
      к письму Бурцева? Наверно, вы просто хотели всем показать и доказать, как отлично вы владеете русским языком: лучше , чем издательство, выпустившее эти книги.
      Кстати, по правилам приличия, если уж вы это "море" нашли, то неплохо было бы нас информировать - ведь книги находятся у вас уже давно. И еще. Книги с таким "морем" мы бы никогда не выложили у себя, с взятием на себя ответственности или нет.
      Книги Андроникова есть сейчас во многих других библиотеках, так что вам не надо делать над собой такое усилие.


СООБЩЕНИЯ ЗА 16.03.2003
182. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 02:21:35 [ответить]
      > 181. Александр Продан.
      > > 180. А.Бурцев.
      > > Приветствую всех, господа! В Интернете складывается уникальная ситуация, а именно - появилось VIP.KM.RU - электронная платная библиотека, поставившая своей целью, ни много, ни мало, - монополизацию эл.библиотек в Интернете!
      >
      > Посмотрел я их сайт. Такой же бардак, как и в большинстве бестолковых нетематических библиотек. Ничего никому они не продадут,
     
      В общем-то я с Вами согласен, хотя меня начинает все больше тревожить одно обстоятельство. Скажем, еще полгода назад было легко найти произведения в электронном виде, скажем, Грибоедова. Яндекс выдавал их самыми первыми строчками. Сейчас уже не так. Совсем не так. Сначала пролистываешь пару страниц, где указываются сайты, торгующие бумажными книгами, потом помойки вроде КМ, потом, где-то на 4-й - 5-й странице начинают встречаться действительно солидные собрания. И эта ситуация становится все хуже и хуже. Взгляните теперь на то же самое глазами полного чайника в сетевой литературе. Он слышал, что, в принципе, можно файлы с книгами бесплатно получать, но слышал и о том, что есть платные. Что, он будет 10-20 страниц по Яндексу перелистывать, если ему какой-то текст очень нужен. Да нет. Купит у этих халтурщиков с КМ или у им подобных...


СООБЩЕНИЯ ЗА 15.03.2003
181. Александр Продан, Кишинев (alexpro@enteh.com) 14:45:35 [ответить]
      > 180. А.Бурцев.
      > Приветствую всех, господа! В Интернете складывается уникальная ситуация, а именно - появилось VIP.KM.RU - электронная платная библиотека, поставившая своей целью, ни много, ни мало, - монополизацию эл.библиотек в Интернете!
     
      Посмотрел я их сайт. Такой же бардак, как и в большинстве бестолковых нетематических библиотек. Ничего никому они не продадут, за исключением тех случаев, когда популярные авторы будут передавать им эксклюзивные права, но эти же авторы предпочитают издаться обычным путем. То что воруют - какая беда. Все воруют, ведь если разобраться, то более половины сетевых библиотек пробавляется ворованным. Вся разница лишь в том, что эти ребята хотят на ворованном заработать. И вы верите, что это возможно? Не американцам же они собираются продавать, а нам. А мы ученые, все что нам нужно мы всегда без денег находим, начиная от операционных систем и кончая банальной порнухой. Так что непонятно, чего испугались. Мне лично просто смешно. Тем более, что мы то народ бескорыстный, выкладываем книги за так, а кто ими пользуется - уже не наше дело. Мы же не авторы этих книг. Для нас же есть и положительный момент, если книга попала в платную библиотеку, то может стоит ее прочесть, правда скачав из другой, бесплатной библиотеки. Будем считать, что эти ребята выполняют, причем совершенно бесплатно!!!, роль маркетолога, рекламщика. Бог им в помощь и дай бог не умереть с голоду.


СООБЩЕНИЯ ЗА 14.03.2003
180. А.Бурцев, 21:10:38 [ответить]
      Приветствую всех, господа! В Интернете складывается уникальная ситуация, а именно - появилось VIP.KM.RU - электронная платная библиотека, поставившая своей целью, ни много, ни мало, - монополизацию эл.библиотек в Интернете! Вот так. Если вы еше не столкнулись с их деятельностью - у вас все приятное впереди. Я же поимел свое удовольствие, когда зашел к ним и обнаружил в платном секторе ряд книг с моей библиотеки (http://fantast2.narod.ru>http://fantast2.narod.ru). Меня это весьма заинтересовало, поскольку книги я вычитываю и сканирую сам, и я предложил им, как честным людям, дать на меня ссылку. (Я бы не сказал, что это так трудно и сложно сделать!). В ответ я получил уже два письма с угрозами и обвинениями меня во всех смертных грехах. К сожалению, они запретили мне публиковать эти письма (весьма предусмотритеольно), но никто не может мне запретить их пересказывать и выражать к ним свое отношение. В частности, они написали, что имеют своей целью вытеснение всех других библиотек из Сети. Они написали, что на мои собственные сканы имеют права исключительно они, крали их и будут красть для своего собственного обогащения (а цена за право пользования ихней библиотеки немалая - 10 баксов в месяц). И вы думаете, крадут сканы они только у меня? Я обнаружил у них книги, покраденные из библиотек: Мошкова, Бомануара, Альдебарана, Лео и многих других. Далее, насколько я их понял, они будут требовать от других убирать украденные сканы из своих библиотек ( у меня уже требуют). Сами они, судя по всему, ничего сканировать не собираются, ткак как с откровенной циничностью написаои мне - пусть дурачки сканируют и корячатся над книгами, а мы будем сливки снимать (так дешевле и проще) да еще пинать их при этом. И уж как страшно при этом грозят, ссылаясь на своих (очевидно многочисленных) юристов. Ну, юрист есть и у меня, и к следующей неделе он подготовит мне выдержки из свода законов, которые я помещу в своей статье.
      В заключение хочу сказать говподам из VIP.KM - воровство, стремление к монополии и наглые наезды - не лучшее начинание деятельности. Вас, как минимум, никто не будет уважать, да и денег, пожалуй, не заработаете.
      Андрей Бурцев.
      Кто хочет, может писать мне: andre154@msn.com


СООБЩЕНИЯ ЗА 06.03.2003
177. PDF-Library, Augsburg, Germany (news@imwerden.de) 09:23:38 [ответить]
      > 176. Сергей Сотников.
      > Доброго времени суток!
      > Оформляя книги в формате pdf, столкнулся с проблемой. При создании содержания в виде закладок (bookmarks) переход не всегда осуществляется правильно. Если закладка находится близко к концу страницы (на глаз - сантиметров 5 и меньше), переход осуществляется на начало следующей страницы. Не знаете ли, как поступить?
      > Использую Adobe Acrobat Business Tools 4.05.
     
      К сожалению, ответа на Ваш вопрос дать не могу - никогда не пользовался Вашей программой, но совет: перенесите новую главу на следующую страницу, а то она у Вас в конце страницы начинается...


СООБЩЕНИЯ ЗА 05.03.2003
176. Сергей Сотников, Минск 22:39:41 [ответить]
      Доброго времени суток!
      Оформляя книги в формате pdf, столкнулся с проблемой. При создании содержания в виде закладок (bookmarks) переход не всегда осуществляется правильно. Если закладка находится близко к концу страницы (на глаз - сантиметров 5 и меньше), переход осуществляется на начало следующей страницы. Не знаете ли, как поступить?
      Использую Adobe Acrobat Business Tools 4.05.


175. MMM, 14:24:19 [ответить]
      я п╣я я


СООБЩЕНИЯ ЗА 27.02.2003
174. David, Boston (david38038@hotmail.com) 08:11:28 [ответить]
      > 170. Гершон.
      > Но проблема в том, что у меня остались файлы в Word. Стирать их жалко, может быть они кому то нужны. Но хочу предупредить, что они не "доведены" до аккуратного состояния, форматирования по полям и.д. Произведений этих нет в интернете. Кроме этого в мои планы входит отсканировать остальные произведения Севелы и другое.
      > Может быть кому то эти призведения интересны, токда бы я их выслал на FTP или Email.
      > Спасибо.
     
      Mne, b'vakasha, na e-mail. Toda raba.


СООБЩЕНИЯ ЗА 26.02.2003
173. Гершон, Хеврон 00:18:34 [ответить]
      > 172. VV.
      > > Я приобрёл сканер UMAX ASTRA 4700, подсоединил его через USB
      >
      > Если не секрет - почём купили?
      > Спасибо.
     
      Купил в интернете за 450 шекелей.
      Сегодня цена уже 550 шекелей (110 долларов)
      http://www.olsale.co.il/olsale/Main.aspx?type=1&Page=1>http://www.olsale.co.il/olsale/Main.aspx?type=1&Page=1


СООБЩЕНИЯ ЗА 25.02.2003
172. VV, 22:53:08 [ответить]
      > Я приобрёл сканер UMAX ASTRA 4700, подсоединил его через USB
     
      Если не секрет - почём купили?
      Спасибо.


171. Максим Мошков, (moshkow@systud.msk.su) 13:58:10 [ответить]
      > 170. Гершон.
      > Может быть кому то эти призведения интересны, токда бы я их выслал на FTP или Email.
     
     
      http://lib.ru/TXT/incoming.txt>http://lib.ru/TXT/incoming.txt


170. Гершон, Хеврон 13:33:48 [ответить]
      > 160. Zmiy.
      > > 159. Гершон.
      > > Пытался найти отсканированные книги Э.Севелы, ничего не нашёл, кроме нескольких произведений.
      > > Поэтому хочу отсканировать свои книги этого автора. Сканирование двойной страницы книги занимает 80 секунд моим старым сканером Mustek 600CP (без обработки OCR). Книг много, уж очень всё это долго.
      > > Какой всё таки быстрый сканер приобрести?
      > > Ещё раз спасибо за информацию.
     
     
      Я приобрёл сканер UMAX ASTRA 4700, подсоединил его через USB 2.
      Очень быстро отсканировал и отредактировал два произведения Э. Севелы "Почему нет рая на земле", "Викинг".
      Я не любитель читать с экрана компьютера, но преимущества книги и большого компьютера объединены в компьютере "для ладони" Palm, поэтому я перевёл полученные файлы в формат PDB.
      Но проблема в том, что у меня остались файлы в Word. Стирать их жалко, может быть они кому то нужны. Но хочу предупредить, что они не "доведены" до аккуратного состояния, форматирования по полям и.д. Произведений этих нет в интернете. Кроме этого в мои планы входит отсканировать остальные произведения Севелы и другое.
      Может быть кому то эти призведения интересны, токда бы я их выслал на FTP или Email.
      Спасибо.


СООБЩЕНИЯ ЗА 24.02.2003
169. Ореховы-Фурс, Питер 03:12:24 [ответить]
      > 168. Rashid.
      > вы что, абалдели совсем, что с самиздатом мошковским происходит?
      > Этот форум самое близкое к теме место коммуникации! если еще работает, почему ни чьих комментариев нет?http://zhurnal.lib.ru/>http://zhurnal.lib.ru/
     
      Кошмар с Самиздатом, Рашид.
      Готовимся к эвакуации.
      Все молчат, некоторых страниц нет совсем, до трибуны не добраться. Пока наши разделы еще "живы", но закачиваем их на HD а всякий случай.


СООБЩЕНИЯ ЗА 22.02.2003
168. Rashid, Earth-Mars (Rashid8@yandex.ru) 20:03:12 [ответить]
      вы что, абалдели совсем, что с самиздатом мошковским происходит?
      Этот форум самое близкое к теме место коммуникации! если еще работает, почему ни чьих комментариев нет?http://zhurnal.lib.ru/>http://zhurnal.lib.ru/


167. VV, 11:44:34 [ответить]
      > 165. InFAiR.
     
      > http://tom.imm.uran.ru/~u1318/djvu/djvu.htm>http://tom.imm.uran.ru/~u1318/djvu/djvu.htm
      > http://subscribe.ru/archive/radio.oldradio/200103/05200802.html>http://subscribe.ru/archive/radio.oldradio/200103/05200802.html
     
      Спасибо, но дежавю, увы, страдает тем же недостатком. Я потратил на немало времени и убедился, что он не годится для качественной графики. Например, опять же для иероглифов. Либо изображение смазано, либо оно по объёму больше, чем jpeg и даже чем правильно сделанный gif.
     
      Не то чтобы второй сорт, но близко к этому.
     
      Кстати, Коэльо это тоже касается.


СООБЩЕНИЯ ЗА 21.02.2003
166. Eugene, Odessa 19:03:39 [ответить]
      > 163. Damirjan.
      > > 147. VV.
      > > Вопрос.
      > >
      > > Я пытаюсь соорудить один многостраничный файл-книжку из серии отсканированных greyscale страниц-картинок.
     
      А Я ПРЕДПОЧИТАЮ WEBEXE http://www.exe-book.ukrbiz.net>http://www.exe-book.ukrbiz.net


165. InFAiR, Уфа (infair@rusoil.net) 16:30:15 [ответить]
     
      > Ладно, я буду пробовать другие пути. Хрен с ним с PDF-ом, попробуем просто HTML+jpg...
     
      - Ошибка их в том, что ...
      ... они искали сокровища, спрятанные на Пути, а сам Путь обходили.
      - Так чего же мне не хватает? - повторил свой вопрос юноша.
     
      Пауло Коэльо "Алхимик"
     
      http://tom.imm.uran.ru/~u1318/djvu/djvu.htm>http://tom.imm.uran.ru/~u1318/djvu/djvu.htm
      http://subscribe.ru/archive/radio.oldradio/200103/05200802.html>http://subscribe.ru/archive/radio.oldradio/200103/05200802.html


164. VV, 12:23:50 [ответить]
      > > ...PDF, но автоматически снижает фактическую точность (resolution) изображения и вообще что-то там обрабатывает и местами портит изображение. Например, каждую картинку пытается чуток повернуть. А мне нужно непременно сохранить исходные файлы как они есть...
      > > Спрашивается, можно ли уговорить FineReader принимать картинки без доп.обработки? А может, есть какой "более другой" freeware/shareware для создания файлов PDF?
     
      > По поводу снижения resolution есть опция "Снижать разрешение до 100 dpi". Уберите эту галочку и все будет ОК.
     
      Увы, это не помогает. Формально размер картинки - как при 300 dpi, a фактически это сначала уменьшенная, а потом увеличенная картинка. Когда речь идёт об обычном тексте - почти незаметно, а если есть вещи тонкие, например иероглифы, - всё портится. Опять же насильственный поворот тоже смазывает мелкие детали.
     
      Ладно, я буду пробовать другие пути. Хрен с ним с PDF-ом, попробуем просто HTML+jpg...


СООБЩЕНИЯ ЗА 20.02.2003
163. Damirjan, Когалым (damirjan@mail.ru) 12:18:41 [ответить]
      > 147. VV.
      > Вопрос.
      >
      > Я пытаюсь соорудить один многостраничный файл-книжку из серии отсканированных greyscale страниц-картинок. FineReader-6 хоть и делает PDF, но автоматически снижает фактическую точность (resolution) изображения и вообще что-то там обрабатывает и местами портит изображение. Например, каждую картинку пытается чуток повернуть. А мне нужно непременно сохранить исходные файлы как они есть. Не менять картинки ни на грамм, просто "сшить" их в один файл-книжку. Формат PDF не так уж и обязателен, хотя и желателен как удобный стандарт.
      >
      > Спрашивается, можно ли уговорить FineReader принимать картинки без доп.обработки? А может, есть какой "более другой" freeware/shareware для создания файлов PDF?
     
      По поводу снижения resolution есть опция "Снижать разрешение до 100 dpi". Уберите эту галочку и все будет ОК.


СООБЩЕНИЯ ЗА 16.02.2003
162. Tark, Москва (tark@altern.org) 15:26:18 [ответить]
      > 161. PDF-библиотека.
      > > 150. Вячеслав Сачков.
      > > Переехал с двадцатника на шестидесятник, после чего файнридер затребовал переустановки.
      >
      > Любопытно до чортиков. А что такое "двадцатник" и "шестидесятник" ??? Я каждый раз поражаюсь - почему же я ничего не понимаю???
     
      Это не поколения, как можно было бы подумать, а всего навсего размеры жесткого диска :-)


161. PDF-библиотека, Augsburg (info@imwerden.de) 11:22:00 [ответить]
      > 150. Вячеслав Сачков.
      > Переехал с двадцатника на шестидесятник, после чего файнридер затребовал переустановки.
     
      Любопытно до чортиков. А что такое "двадцатник" и "шестидесятник" ??? Я каждый раз поражаюсь - почему же я ничего не понимаю???


СООБЩЕНИЯ ЗА 15.02.2003
160. Zmiy, Минск (zmiy@inbox.ru) 21:56:18 [ответить]
      > 159. Гершон.
      > Пытался найти отсканированные книги Э.Севелы, ничего не нашёл, кроме нескольких произведений.
      > Поэтому хочу отсканировать свои книги этого автора. Сканирование двойной страницы книги занимает 80 секунд моим старым сканером Mustek 600CP (без обработки OCR). Книг много, уж очень всё это долго.
      > Какой всё таки быстрый сканер приобрести?
      > Ещё раз спасибо за информацию.
     
      В интернете есть :
     
      Севела Эфраим
      Зуб мудрости
      Моня Цацкес - знаменосец
      Остановите самолет - я слезу !
      Попугай, говорящий на идиш
      Продай твою мать
     
      Для информации :
      У меня планшетный сканер Mustek 1200CU (цена ~ 70-80$).
      Скорость сканирования в ч/б: min - 170, max - 200 стр./час.
      (200 стр. = 100 разворотов книги (двойных страниц) )
     
      P.S. Если на странице не много ошибок, то ФР ничего не "притормаживает"!
      Я успеваю за время обратного хода перевернуть лист книги...


СООБЩЕНИЯ ЗА 14.02.2003
159. Гершон, Хеврон 18:29:14 [ответить]
      > 158. DR.
      > > 157. Гершон.
      > > Мне нужно просканировать текст книг на русском языке и ничего более.
      >
      > Тогда IMHO нет смысла тратиться на новый сканер. Тем более супер-быстродействующий. Всё равно FineReader почти наверняка будет его притормаживать своим OCR-ом. И вообще, по слухам, в сетевом подполье (mIRC, newsgroups и т.д.) ходит-бродит столько отсканированных текстов, что надо хорошенько проверить - может, книги-то уже давно отсканированы.
      Пытался найти отсканированные книги Э.Севелы, ничего не нашёл, кроме нескольких произведений.
      Поэтому хочу отсканировать свои книги этого автора. Сканирование двойной страницы книги занимает 80 секунд моим старым сканером Mustek 600CP (без обработки OCR). Книг много, уж очень всё это долго.
      Какой всё таки быстрый сканер приобрести?
      Ещё раз спасибо за информацию.


158. DR, 16:40:07 [ответить]
      > 157. Гершон.
      > Мне нужно просканировать текст книг на русском языке и ничего более.
     
      Тогда IMHO нет смысла тратиться на новый сканер. Тем более супер-быстродействующий. Всё равно FineReader почти наверняка будет его притормаживать своим OCR-ом. И вообще, по слухам, в сетевом подполье (mIRC, newsgroups и т.д.) ходит-бродит столько отсканированных текстов, что надо хорошенько проверить - может, книги-то уже давно отсканированы.


157. Гершон, Хеврон 00:00:46 [ответить]
      Уважаемый DR!
      Спасибо за Ваше сообщение.
      Мне нужно просканировать текст книг на русском языке и ничего более.
      > 156. DR.
      > > 155. Гершон.
      > > Посоветуйте, пожалуйста, какой сканер (планшетного типа) лучше приобрести для сканирования книг, чтобы на сканирование страницы
      > > уходило как можно меньше времени. Компьютер Pent.3, Windows 98 SE.
      > > Спасибо.
      >
      > Однозначного ответа нет. Зависит, какие страницы Вы собираетесь главным образом сканировать. Тексты или цветные картинки, например. И какая точность (resolution) Вас интересует. Например, если это иврит с диакритическими знаками, книга видавшая виды и шрифт мелкий, то обычных 300 dpi, может, и хватит, но "с натягом".
      >
      > И насколько важно, чтобы помещался разворот книги, не влезающий в стандартный планшет Letter-long, то есть нужен ли планшет А3. Такие сканнеры тоже есть, но они очень дорогие. Есть ещё сканнеры быстрые из-за более прогрессивного принципа сканирования, но и они весьма недёшевы.
      >
      > И, наконец, ради моральной поддержки героических хевронцев :) если интересует подержанный, но абсоютно исправный сканнер по символической цене, самовывозом из Рамат-Гана или окрестностей - сообщите координаты. Ну а если не интересует - всё равно примите наилучшие пожелания :)


СООБЩЕНИЯ ЗА 13.02.2003
156. DR, 23:20:37 [ответить]
      > 155. Гершон.
      > Посоветуйте, пожалуйста, какой сканер (планшетного типа) лучше приобрести для сканирования книг, чтобы на сканирование страницы
      > уходило как можно меньше времени. Компьютер Pent.3, Windows 98 SE.
      > Спасибо.
     
      Однозначного ответа нет. Зависит, какие страницы Вы собираетесь главным образом сканировать. Тексты или цветные картинки, например. И какая точность (resolution) Вас интересует. Например, если это иврит с диакритическими знаками, книга видавшая виды и шрифт мелкий, то обычных 300 dpi, может, и хватит, но "с натягом".
     
      И насколько важно, чтобы помещался разворот книги, не влезающий в стандартный планшет Letter-long, то есть нужен ли планшет А3. Такие сканнеры тоже есть, но они очень дорогие. Есть ещё сканнеры быстрые из-за более прогрессивного принципа сканирования, но и они весьма недёшевы.
     
      И, наконец, ради моральной поддержки героических хевронцев :) если интересует подержанный, но абсоютно исправный сканнер по символической цене, самовывозом из Рамат-Гана или окрестностей - сообщите координаты. Ну а если не интересует - всё равно примите наилучшие пожелания :)


155. Гершон, Хеврон 20:38:07 [ответить]
      Посоветуйте, пожалуйста, какой сканер (планшетного типа) лучше приобрести для сканирования книг, чтобы на сканирование страницы
      уходило как можно меньше времени. Компьютер Pent.3, Windows 98 SE.
      Спасибо.


СООБЩЕНИЯ ЗА 11.02.2003
154. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 03:34:59 [ответить]
      > 152. Олег Френкель.
      > > 149. Вячеслав Сачков.
      > > > 148. Олег Френкель.
      > > > > 130. Вячеслав Сачков.
      > > > > > 128. Zmiy.
      я, как рядовой читатель, выразил свое мнение в каких категориях хотел бы найти книжки (но не к каким категориям относить эти книжки!). И привел пример с однотомником Лермонтова и книгами Бушкова. Более того, я думаю вам, библиографам, стоит иногда прислушаться к пожеланиям дилетантов (конечно же, только в плане использования библиотек, а не в их устройстве). Ведь основная масса читателей -- дилетанты в библиогафии. А подавляющее большинство библиотек в интернете расчитано именно на дилетантов.
      >
      > В общем виде, я могу сформулировать проблему следующим образом. Каким образом организовать электронную библиотеку чтобы читателю было наиболее просто найти интересующую его книжку. Если же вы имели в виду другую проблему с этой совершенно не связанную, я приношу свои извинения что влез не поняв о чем идет речь. В противном случае, можно обменяться мнениями.
     
      Не хочется мне Вас обижать, но если честно, то для рядового читателя никакой организации никакой рубрикации, по моему глубокому убеждению, вообще не нужно. Вам нужен Бушков? Какие проблемы? Набрал в Яндексе это имя и все дела. Через полгода это имя никто помнить не будет, но Вам его книги нужны здесь и теперь. Другое дело, если Вы всерьез занимаетесь, например, изучением творчества и биографии Льва Толстого. По первому проходу в сети появляются одни его главнейшие произведения. По второму - менее известные. По третьему - основные критические работы. По четвертому - обзоры критики. По пятому - архивные материалы. По шестому - обзоры по архивным материалам. И т.д. Если бы Вы имели дело с "бумажной" литературой и Ваша задача была в том, чтобы просмотреть все контексты толстовского выражения "И во тьме правда светит", Вам пришлось бы сделать титаническую работу. В сети, по идее, это сделать гораздо проще. Проблема тут в том, что не всегда это выражение воспроизводится буквально точно, есть искажения. Как с этим бороться - отдельный большой вопрос, но на подходе к его решению крайне необходима рубрикация, которую нельзя создать готовой прямо сразу (см. вышеперечисленные проходы, для каждого из них только своя рубрикация годится), поэтому приходится делать рубрикацию "на вырост", представляя себе, как она будет развиваться в дальнейшем.


153. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 05:59:17 [ответить]
      > 151. Григорий.
      > > 150. Вячеслав Сачков.
      > > Переехал с двадцатника на шестидесятник, после чего файнридер затребовал переустановки. Быват. Но чтобы притом слетали рабочие пакеты - это архисвинство. Месяц работы коту под хвост. :-( Джими Хендрикс в таких ситуациях пел FHITA.
      >
      > Как слетали? В чем это проявлялось?
     
      Очень просто. Обращаюсь к пакету, ФР отвечает: какой-то там .dat полетел, попробую восстановить, тыр-пыр 2 часа без результата. Сколько еще ждать? Выключил, естественно. Все. Впрочем, надул я эту тупую скотину все-таки. Просто вошел в каталог, вызвал одну из картинок и вместе с ней весь пакет, куда ему положено, и выкатился.


152. Олег Френкель, Торонто (znamenka@yahoo.com) 01:49:20 [ответить]
      > 149. Вячеслав Сачков.
      > > 148. Олег Френкель.
      > > > 130. Вячеслав Сачков.
      > > > > 128. Zmiy.
      > > >
      > Дорогой друг! Библиография - это очень серьезная и большая наука, которой в ин-те культуры учатся 5 лет, для того чтобы получить минимальные познания по этому предмету. Это "бумажная" библиография, которая сильно ПРОЩЕ файловой. Давайте не будем упрощать проблемы. Тут осторожность, осторожность и осторожность нужна. А дилетанство губительно.
     
      Согласен, что библиография - это очень серьезная и большая наука. К тому же я никогда не изучал библиографию. Более того, я не совсем точно представляю себе о чем эта наука. Я о ней и не пытался высказываться. Просто я, как рядовой читатель, выразил свое мнение в каких категориях хотел бы найти книжки (но не к каким категориям относить эти книжки!). И привел пример с однотомником Лермонтова и книгами Бушкова. Более того, я думаю вам, библиографам, стоит иногда прислушаться к пожеланиям дилетантов (конечно же, только в плане использования библиотек, а не в их устройстве). Ведь основная масса читателей -- дилетанты в библиогафии. А подавляющее большинство библиотек в интернете расчитано именно на дилетантов.
     
      В общем виде, я могу сформулировать проблему следующим образом. Каким образом организовать электронную библиотеку чтобы читателю было наиболее просто найти интересующую его книжку. Если же вы имели в виду другую проблему с этой совершенно не связанную, я приношу свои извинения что влез не поняв о чем идет речь. В противном случае, можно обменяться мнениями.


СООБЩЕНИЯ ЗА 10.02.2003
151. Григорий, Ярославль 22:03:16 [ответить]
      > 150. Вячеслав Сачков.
      > Переехал с двадцатника на шестидесятник, после чего файнридер затребовал переустановки. Быват. Но чтобы притом слетали рабочие пакеты - это архисвинство. Месяц работы коту под хвост. :-( Джими Хендрикс в таких ситуациях пел FHITA.
     
      Как слетали? В чем это проявлялось?


150. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:48:03 [ответить]
      Переехал с двадцатника на шестидесятник, после чего файнридер затребовал переустановки. Быват. Но чтобы притом слетали рабочие пакеты - это архисвинство. Месяц работы коту под хвост. :-( Джими Хендрикс в таких ситуациях пел FHITA.


149. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:22:24 [ответить]
      > 148. Олег Френкель.
      > > 130. Вячеслав Сачков.
      > > > 128. Zmiy.
      > >
      > > Взять, например, хороший однотомник Лермонтова, где проза, поэзия и драматургия в одном "флаконе" находятся. К какому из предлагаемых трех разделов такое издание относить? Или это именно единственно возможный случай для раздела "Остальное"?
      >
      > На мой взгляд, этот однотомник Лермонтова надо отнести ко всем трем разделам. А раздел "Остальное" свести к минимуму, а желательно вообще исключить. Кстати, именно по этой причине я
     
      Дорогой друг! Библиография - это очень серьезная и большая наука, которой в ин-те культуры учатся 5 лет, для того чтобы получить минимальные познания по этому предмету. Это "бумажная" библиография, которая сильно ПРОЩЕ файловой. Давайте не будем упрощать проблемы. Тут осторожность, осторожность и осторожность нужна. А дилетанство губительно.


СООБЩЕНИЯ ЗА 09.02.2003
148. Олег Френкель, Торонто (znamenka@yahoo.com) 05:14:48 [ответить]
      > 130. Вячеслав Сачков.
      > > 128. Zmiy.
      >
      > Взять, например, хороший однотомник Лермонтова, где проза, поэзия и драматургия в одном "флаконе" находятся. К какому из предлагаемых трех разделов такое издание относить? Или это именно единственно возможный случай для раздела "Остальное"?
     
      На мой взгляд, этот однотомник Лермонтова надо отнести ко всем трем разделам. А раздел "Остальное" свести к минимуму, а желательно вообще исключить. Кстати, именно по этой причине я пользуюсь только поиском на мошковской библиотеке. Скажем, я хочу почитать Бушкова. В какой раздел мне идти? Фантастика, история, современная проза? Ясное дело, я не помню в каком разделе Бушков находится у Мошкова, хотя относится ко всем трем. А по идее должен находится во всех разделах к которым относится. И меня, как читателя, не смутит факт что я пошел в раздел "история", а там книжки Бушкова не только про историю. Смущает меня, наоборот: я иду в раздел "история", а там нет книжек Бушкова про историю.
     
      Надеюсь, мне не будут возражать в том плане что если поместить книжку в нескольких разделах, то придется хранить её в нескольких копиях (во всех разделах хранится ссылка на одну копию -- впрочем это очевидно).


СООБЩЕНИЯ ЗА 05.02.2003
147. VV, 12:21:49 [ответить]
      Вопрос.
     
      Я пытаюсь соорудить один многостраничный файл-книжку из серии отсканированных greyscale страниц-картинок. FineReader-6 хоть и делает PDF, но автоматически снижает фактическую точность (resolution) изображения и вообще что-то там обрабатывает и местами портит изображение. Например, каждую картинку пытается чуток повернуть. А мне нужно непременно сохранить исходные файлы как они есть. Не менять картинки ни на грамм, просто "сшить" их в один файл-книжку. Формат PDF не так уж и обязателен, хотя и желателен как удобный стандарт.
     
      Спрашивается, можно ли уговорить FineReader принимать картинки без доп.обработки? А может, есть какой "более другой" freeware/shareware для создания файлов PDF?


146. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 04:28:59 [ответить]
      > 128. Zmiy.
     
      > Сейчас в группах новостей RU.OCR и SU.BOOKS проходит обсуждение предложения В.Ершова.
      > См. тему "А-y! Деpжатели сетевых библиотек!"
      > Там Слава Алексеев предлагает на суд свой вариант "поискового классификатора для электронных библиотек"...
      > Вход, например, тут http://www.fido-online.com/>http://www.fido-online.com/
     
      Я все-таки не понял, что ты там интересного нашел? Подробную клссификацию порнографии по Максимовой, что ли? Мне лично она по фиг. А что еще?


СООБЩЕНИЯ ЗА 03.02.2003
145. Zmiy, Минск (zmiy@inbox.ru) 14:01:57 [ответить]
      > 135. InFAiR.
      > > 132. Zmiy.
      >
      > > тайна "Золотого ключика"
      >
      > :) Открыть в Word
      > Ctrl+F; Найти "Специальный" "разрыв строки";
      > "Заменить все"
      > ОК, ОК, ОК ... пока не увидишь "Произведено 0 замен"
     
      goto Label_l40


144. PDF-Library, Augsburg, Germany (news@imwerden.de) 15:22:00 [ответить]
      > 141. Zmiy.
      > > 133. ЯVR.
      > > А у меня вопрос : как убить дикое количество пробелов в распознанном тексте ? (FR 6) Файлы txt.
      >
      > Скачай тут набор маленьких программ на все случаи жизни:
      > http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm
     
      > В общем, что уже сделано - то есть, а доделок-переделок не будет.
      > Архив программ LLEOSOFT.ZIP - 55кб
      > В этом комплекте находятся 36 мелких программок для обработки текстов, они написаны под DOS и хороши
     
      А что такое DOS ?????
     
      Этим самым DOS не пользуются уже 99,99 %, а тем более такими программами для DOS, которым нужен русский DOS...


СООБЩЕНИЯ ЗА 31.01.2003
141. Zmiy, Минск (zmiy@inbox.ru) 10:47:12 [ответить]
      > 133. ЯVR.
      > А у меня вопрос : как убить дикое количество пробелов в распознанном тексте ? (FR 6) Файлы txt.
     
      Скачай тут набор маленьких программ на все случаи жизни:
      http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm


СООБЩЕНИЯ ЗА 03.02.2003
140. Zmiy, Минск (zmiy@inbox.ru) 14:01:25 [ответить]
      > 139. Вячеслав Сачков.
      >
      > Может быть, я тебя неправильно понял, но общий принцип борьбы с неправильным разбиением на абзацы такой. В FP6 есть опция "Разрыв строк между абзацами". Имеет смысл пробовать с ней и без нее и сравнивать. Я попробовал. Если гнать сразу в дос, в какой-нибудь нафигатор, точно сильно лучше - с ликвидацией ненужных пустых строк по только что описанной здесь методике. В виндовозе не пробовал, поэтому не скажу. Но, наверно, помогает.
     
      Возможно и не понял... --------------;-)
     
      ФР5/6 при сохранении в ТХТ с "разрывом строк между абзацами" вставляет эти "разрывы" (пустые строки) аналогично - неправильно - после своего же, неправильно определенного, конца абзаца (перевода строки)...
     
      Label_l40 :
      Если захочется поэкспериментировать, то скачай мои файлы, что я предлагал, и опиши методику сохранения текста из ФР5/6 в куда-нибудь и обработки его так, чтобы получился вариант test4.tx1, где ФР4 абсолютно точно воспроизвел разбиение на абзацы, выделив их тремя пробелами и при этом они полностью совпадают с абзацами из TIFFов...


СООБЩЕНИЯ ЗА 31.01.2003
139. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:54:44 [ответить]
      > 132. Zmiy.
      > Привет All!
      >
      > Не будет ли любезен многоуважаемый All раскрыть тайну "Золотого ключика"?
      >
      > Абзацем считается несколько предложений не разделенных переводом строки. Это видно в ФР или в Ворде, если включить отображение непечатаемых символов. Если есть перевод строки - это новый абзац.
      >
     
      Может быть, я тебя неправильно понял, но общий принцип борьбы с неправильным разбиением на абзацы такой. В FP6 есть опция "Разрыв строк между абзацами". Имеет смысл пробовать с ней и без нее и сравнивать. Я попробовал. Если гнать сразу в дос, в какой-нибудь нафигатор, точно сильно лучше - с ликвидацией ненужных пустых строк по только что описанной здесь методике. В виндовозе не пробовал, поэтому не скажу. Но, наверно, помогает.


СООБЩЕНИЯ ЗА 30.01.2003
138. ЯVR, 20:54:33 [ответить]
      > 137. InFAiR.
      > > 136. ЯVR.
      > > Ничего не получается :)))
      >
      > Ясное дело! В окошке "найти" надо не писать "два пробела",
      > а два раза на клавишу "пробел" нажать!
     
      :))) Вот теперь до меня дошло.


137. InFAiR, Уфа (infair@rusoil.net) 20:20:02 [ответить]
      > 136. ЯVR.
      > Ничего не получается :)))
     
      Ясное дело! В окошке "найти" надо не писать "два пробела",
      а два раза на клавишу "пробел" нажать!


136. ЯVR, 19:44:40 [ответить]
      > 134. InFAiR.
      > > 133. ЯVR.
      > > дикое количество пробелов
      >
      > :) Открыть в Word
      > Ctrl+F; Найти "два пробела"
      > Заменить "один пробел"
      > "Заменить все"
      > ОК, ОК, ОК ... пока не увидишь "Произведено 0 замен"
     
     
      Ничего не получается :)))


135. InFAiR, Уфа (infair@rusoil.net) 18:54:58 [ответить]
      > 132. Zmiy.
     
      > тайна "Золотого ключика"
     
      :) Открыть в Word
      Ctrl+F; Найти "Специальный" "разрыв строки";
      "Заменить все"
      ОК, ОК, ОК ... пока не увидишь "Произведено 0 замен"


134. InFAiR, Уфа (infair@rusoil.net) 18:37:48 [ответить]
      > 133. ЯVR.
      > дикое количество пробелов
     
      :) Открыть в Word
      Ctrl+F; Найти "два пробела"
      Заменить "один пробел"
      "Заменить все"
      ОК, ОК, ОК ... пока не увидишь "Произведено 0 замен"


133. ЯVR, 16:12:16 [ответить]
      А у меня вопрос : как убить дикое количество пробелов в распознанном тексте ? (FR 6) Файлы txt.


Continue