Список форумов |  Добавить сообщение |  Правила |  11.09.2025, четверг, 11:15:29
СПИСОК ФОРУМОВ
11.09.2025
10:45 Главная гостевая книга библиотеки(5852)
09:07 Обо всем - мнения(3149)
06.09.2025
15:23 "Разыскивается песня", доска объявлений(5441)
02.09.2025
12:08 "Разыскиваются книжки", доска объявлений(15508)
10:11 Проблемы OCR и электронных библиотек(1973)
16.08.2025
07:39 Книжки, которые скоро будут выложены(56)
02.05.2025
21:25 О возвышенной поэзии(1593)
24.02.2025
13:09 Книжки, которые стоит прочитать(5230)
13:05 Водный и всякий туризм(87)
22.02.2025
06:11 Русские впечатления о заграничной жизни(9443)
05:34 Мнения читателей о дизайне библиотеки(1479)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 05.12.2003
468. ЯVR, 16:03:51 [ответить]
      > 463. Zmiy.
      > > 462. ЯVR.
      > > А какой прогой удобней всего вычитывать/редактировать текст в .txt ?
      >
      > Я вычитываю в FARе...
      > А так все обычно используют MS Word, т.к. в нем есть широкие возможности по редактированию, форматированию, поиску-замене и проверке орфографии...
     
      Как ни странно я тоже использую Ворд :) но вот увидел всякие красивые проги-читалки и подумал, что для вычитки/редактирования тоже есть что-то красивое ;) (фон, сглаживание и т.п.)


467. Alla, 14:09:27 [ответить]
      > [464. п А я так это просто в Word делаю, без всяких прибамбасов, через Autoformat. Только там надо Preserve styles отключить.


466. Zmiy, Минск (zmiy@inbox.ru) 14:00:44 [ответить]
      > 464. Лягушонок.
      > Люди, кто нибудь знает как убирать лишние знаки перевода на другкю сторчку. Потому что текст выровнян и растянуть его по странице нет никакой возможности, кроме как убирать эти значки в ручную, а это очень долго и тело все затекает...
     
      Чтобы убрать лишние переводы строк, в тексте должны быть как-то выделены абзацы (например, несколькими пробелами), иначе весь текст получится одним абзацем...
      Использовать можно, например, программку PREWORD.COM из набора утилит от LLEO - http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm . Скачайте там архив и почитайте !README - там много полезных программ обработки текста...
      А можно взять мою утилитку CLTXT.EXE - http://zmiy.by.ru/>http://zmiy.by.ru/ . Она, кроме удаления лишних переводов строк, еще и убирает переносы слов...
      Если же текст в формате DOC, то можно либо сохранить в формат TXT, обработать текст предложенными утилитками, а потом загрузить текст в Word и отформатировать красиво, либо использовать возможности самого Wordа - поиск и замена, нажать кнопочку "Больше" и там выбрать "Специальные символы". Кроме того существуют дополнительные макросы для Wordа, которые тоже очень полезны - например, макрокоманда "Конвертор текста MS-DOS" в наборе макросов "Верстка книжкой" - http://www.newtech.ru/~orlov/verstka.htm>http://www.newtech.ru/~orlov/verstka.htm .


465. юВДПЖ, жГМТЮВ (chrt-hum@mtu-net.ru) 13:53:43 [ответить]
      > 464. Лягушонок.
      > Люди, кто нибудь знает как убирать лишние знаки перевода на другкю сторчку. Потому что текст выровнян и растянуть его по странице нет никакой возможности, кроме как убирать эти значки в ручную, а это очень долго и тело все затекает...
     
      Запускаешь Ultraedit и меняешь сочетание кодов 0D0A (перевод) на 20 (пробел). Могу также выслать курочилку word'овских файлов на эту тему.


464. Лягушонок, САранск (badoka@list.ru) 10:36:02 [ответить]
      Люди, кто нибудь знает как убирать лишние знаки перевода на другкю сторчку. Потому что текст выровнян и растянуть его по странице нет никакой возможности, кроме как убирать эти значки в ручную, а это очень долго и тело все затекает...


463. Zmiy, Минск (zmiy@inbox.ru) 10:10:39 [ответить]
      > 462. ЯVR.
      > А какой прогой удобней всего вычитывать/редактировать текст в .txt ?
     
      Я вычитываю в FARе...
      А так все обычно используют MS Word, т.к. в нем есть широкие возможности по редактированию, форматированию, поиску-замене и проверке орфографии...


СООБЩЕНИЯ ЗА 04.12.2003
462. ЯVR, 22:01:56 [ответить]
      А какой прогой удобней всего вычитывать/редактировать текст в .txt ?


СООБЩЕНИЯ ЗА 25.11.2003
461. Den, 18:30:29 [ответить]
      GreyLib в очередной раз прикрыли за нарушение авторских прав. Но там вебмастер упорный, поэтому есть надежда что сайт восстановится. Пока что попробуйте http://greylib.by.ru/libchild.htm>http://greylib.by.ru/libchild.htm - это старая версия сайта, там нет последних обновлений и кое-какие ссылки не работают. но кое-что есть. плюс, там все еще работает форум, попробуйте поспрашивать там.


461. Alex, 15:26:41 [ответить]
      Люди, а не знает ли кто, что случилось с библиотекой GreyLib?


СООБЩЕНИЯ ЗА 23.11.2003
460. Павел, Самара (libword@narod.ru) 08:54:40 [ответить]
      > 452. Кatia.
      > Кто-нибудь может объяснить, что случилось с библиотекой "Моя библиотека" по адресу www.libword.ru, кажется? Там книжки были по философии, филологии, с постраничной разбивкой. Сервер не пускает, говорит, что нарушение правил или ошибка. Очень жалко ресурс!
     
      К сожалению, сайт прикрыли. Пытаюсь опять востановить на "народе", но оттуда меня уже удаляли. Может быть и там я продержусь недолго.
      Предлагю всем желающим (тем, кто имеет такую возможность)разместить мой архив у себя совершенно бесплатно. Пишите. :((


СООБЩЕНИЯ ЗА 17.11.2003
458. А, M 22:23:41 [ответить]
      Замечания(предложения по ММ 453).
      Не все понял...
      Предложение -
      1) можно перевести обсуждение идеи в отдельный форум(возможно с иерархией сабжей) - чтоб параллельно разрабатывать и достраивать несколько тем(а не идти линейно) -это так - на досуге
     
      а так, вообще - гл вопрос - публикация - на Либ.ру отличный каталоги, в котором масса книг(тоже на Либ.ру:)..проблемы - чел сделал книжку и сделал сайт под нее, но хочет, чтоб она была в общем каталоге(поэтому требовать такого от Либ.ру нелогично - здесь только "свои" книжки в своем (возможно наиболее оптимальном) формате) - нельзя требовать, чтобы в каталоге на Либ.ру были книги не с Либ.ру, а ссылки на ресурсы в Сети(к тому, же вероятно, с ошибками, без курсива:), и в самых разных форматах(однако же тоже, вполне читаемых)) - в этом проблема, - значит надо создать такой механизм и такой каталог... Я преклоняюсь перед Либ.ру, более того, она никуда не денется и наверняка, авторы отдельных ресурсов не будут против, если книжки с их ресурсов будут со временем попадать на Либ.ру, однако же такой мета-каталог даст возможность делать новые книжки доступными сразу, не дожидаясь пока они появятся на Либ.ру(опять же, кто-то захочет сделать отдельный сайт, посвященный какой книжке(вдруг)) - ясно, он может зарег-ить его в поисковиках, но преимущество такого каталога(будет) как раз в том, что здесь (будут) готовые тексты(ссылки на них - почему мы ищем книги на Либ.ру а не через Рамблер) - в общем фишка в том, чтоб дать возможность оср-кам сразу ставить книги в такой каталог(минуя ММ:).. отсюда надо и плясать(кажись) - кого и как и кто будет регистрировать для такого доступа к такому каталогу...
      А может не надо никакой регистрации - просто один чел держит такой каталог - при нем гостевуха для новых книг - туда люди скидывают ссылки на новые (оср)тексты в сети, держатель мета-каталога просто смотрит в гостевухе, идет по ссылке - если текст на месте, ссылку на него в каталог по механизму типа из сабжа 450... Как я люблю распределенные системы(из-за их анархичности!)... и как трудно заставить их нормально работать:)))))( - но можно( - я верю в светлое анархическое будущее человечества:)


457. Zmiy, Минск (zmiy@inbox.ru) 15:15:58 [ответить]
      > 454. InFAiR.
      > > 453. Максим Мошков.
      > > Господа OCR'щики, я наконец осознал, как это все должно выглядеть (хотя бы в общих чертах).
      >
      > ...
      >
      > Интересно, что появилось слово "закрытый".
      > Итнересно, что значит "левые посетители"?
     
      "Зарегистрированные" - те, кто сканирует, вычитывает книги и предоставляет их для библиотеки.
     
      "Левые" - "незарегистрированные", читатели книг, посетители библиотеки.


456. Yesaulov, Moscow 13:13:48 [ответить]
      > 455. Yesaulov.
      > > 454. InFAiR.
      > > Итнересно, что значит "левые посетители"?
      >
     
      Тот, кто отсканировал, тот и "отвечает за базар", т.е. за соответствие оригиналу (публикации).
      А вот остальные и есть "левые", которые можут напортачить в тексте, после чего и сам черт не разберется...
     
      Я так понимаю.


454. InFAiR, хЖБ (infair@rusoil.net) 08:33:16 [ответить]
      > 453. Максим Мошков.
      > Господа OCR'щики, я наконец осознал, как это все должно выглядеть (хотя бы в общих чертах).
     
      О! Ура!
      Наконец появится место сбора ...
     
      Интересно, что появилось слово "закрытый".
      Итнересно, что значит "левые посетители"?


453. Максим Мошков, 03:00:08 [ответить]
      Господа OCR'щики, я наконец осознал, как это все должно выглядеть (хотя бы в общих чертах).
     
      Надо делать библиотеку библиотек - универсальный сайт для закачки отсканированных произведений, с самопубликацией по принципу http://zhurnal.lib.ru>http://zhurnal.lib.ru, но с очень серьезными дополнениями.
     
      Если вкратце: клубный (закрытый) вход - к текстам допускаются только зарегистрированные пользователи.
      Регистрируем только тех, кто сканирует и размещает книги.
     
      Для "левых" посетителей - открыты оглавления и списки произведений.
     
      Одновременно ведется параллельный суммарный список всех авторов из всех окр-разделов.
     
      Одновременно ведется список внешних линков на оригиналы книг.
     
      Одновременно пакетный импорт мета-списков.
     
      Авторизация, много-ранговые уровни доступа.
     
      Так это выглядит в наброске.
     
      Программировать все это начну с середины декабря.
     
      Подробности и т/з буду обсуждать здесь, в этой гостевой. Любые советы, замечания и пожелания - welcome.
     
      Пока работы не начаты, полезно и поспорить по основным пунктам этого проекта.


СООБЩЕНИЯ ЗА 16.11.2003
452. Кatia, 23:13:47 [ответить]
      Кто-нибудь может объяснить, что случилось с библиотекой "Моя библиотека" по адресу www.libword.ru, кажется? Там книжки были по философии, филологии, с постраничной разбивкой. Сервер не пускает, говорит, что нарушение правил или ошибка. Очень жалко ресурс!


СООБЩЕНИЯ ЗА 09.11.2003
451. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:16:27 [ответить]
      > 450. А.
      > Все может быть проще гораздо - смотрите -
      > 1. Каждый может на халяву сделать сайт.
      > 2. Кто хочет - сканит книгу и выкладывает ее на этот сайт - сами понимаете, кому нужна книга, дизайн(самого сайта) почти по барабану(типа собого знания html не нужно)
      > 3. Есть форумы как здесь - в виде гостевух - сообщение идет за сообщением, а есть(и тоже, кажись, можно найти халяву) - где можно образовывать иерархические(то есть древовидные) структуры - но это же может быть и структура библио-каталога - все просто - например - ветвь - классика, внутри нее, там не знаю, русская классика... - все как на Либ.ру - например(чтобы не изобретать велосипед)
      > 4. Тот, кто отсканил и сделал сайт - заходит в этот форум-каталог - находит автора, потом если он есть в этой ветке форума просто нажимает "добавить сообщение" и пишет в это сообщение в Теме - название отсканенной книги, а в тексте сообщения - вероятно просто урл с сайтом - ну, кстати и примечания можно туда же запихнуть при желании.. если автора нет - соответственно, в нужной ветке(например, "Русская классика") пишет имя автора(например, Пушкин:), - так открывается новый раздел каталога - новая ветка этого форума, чел туда заходит, снова жмет "Добавить сообщение" и уже заносит туда свою книжку...
      > 5. Все... Один такой мега-форум можно вообще открыть(теоретически, конечно:) для народа(вариант - сделать регистрацию на этом форуме по факту хотя бы одной отсканеной челом книжки), а второй - чистовой сделать - типа - кто за модератора - смотрит, если есть такой урл и т.д... Есть проблема возможного засорения, но зато как бы ничто не мешает чел-ку при желании выложить отсканенную книжку, в этом он становиться независим...
     
      Дык инициатива наказуема. Делайте, а мы Вас будем ругать за то, что у Вас не получится. А ежели Вам самими делать предлагаемое Вами не по силам, позвольте отнестись к сообщенному Вами как к пустым звукам.


СООБЩЕНИЯ ЗА 13.11.2003
450. А, M 21:04:53 [ответить]
      Все может быть проще гораздо - смотрите -
      1. Каждый может на халяву сделать сайт.
      2. Кто хочет - сканит книгу и выкладывает ее на этот сайт - сами понимаете, кому нужна книга, дизайн(самого сайта) почти по барабану(типа собого знания html не нужно)
      3. Есть форумы как здесь - в виде гостевух - сообщение идет за сообщением, а есть(и тоже, кажись, можно найти халяву) - где можно образовывать иерархические(то есть древовидные) структуры(кажется, например, такие(форумы) есть на by.ru) - но это же может быть и структура библио-каталога - все просто - например - ветвь - классика, внутри нее, там не знаю, русская классика... - все как на Либ.ру - например(чтобы не изобретать велосипед)
      4. Тот, кто отсканил и сделал сайт - заходит в этот форум-каталог - находит автора, потом если он есть в этой ветке форума просто нажимает "добавить сообщение" и пишет в это сообщение в Теме - название отсканенной книги, а в тексте сообщения - вероятно просто урл с сайтом - ну, кстати и примечания можно туда же запихнуть при желании.. если автора нет - соответственно, в нужной ветке(например, "Русская классика") пишет(тоже в "Теме" нового сообщения) имя автора(например, Пушкин:), - так открывается новый раздел каталога - новая ветка этого форума, чел туда заходит, снова жмет "Добавить сообщение" и уже заносит туда свою книжку...
      5. Все... Один такой мега-форум можно вообще открыть(теоретически, конечно:) для народа(вариант - сделать регистрацию на этом форуме по факту хотя бы одной отсканеной челом книжки), а второй - чистовой сделать - типа - кто за модератора - смотрит, если есть такой урл и т.д... Есть проблема возможного засорения, но зато как бы ничто не мешает чел-ку при желании выложить отсканенную книжку, в этом он становиться независим...
      Надо будет организовать поиск..


СООБЩЕНИЯ ЗА 07.11.2003
449. Alla, 19:25:22 [ответить]
      Gospoda professionali, pomogite razobratsa chto tut s kodirovkami sluchilos. Ranshe pisala na kirillice bez problem, teper ne poluchaetsia. Vse vozmozhnie shrifti v Winduzah podkluchila, vse kodirovki pereprobovala, ne poluchaetsia dazhe s konverterom - poka pishu v okne "Dobavit soobshenie", kirillica normalno chitaetsia, kak tolko posilau soobshenie v forum, na lente vilezaet fignia. Help!


448. Im Werden, Augsburg, Germany (info@imwerden.de) 11:50:02 [ответить]
      > 447. Sokolov.
      > > 442. А.
      > и делается попытка реализовать ее на практике.
     
      Gde??


447. Sokolov, N.Novgorod (sokolov_av@pochtamt.ru) 09:32:44 [ответить]
      > 442. А.
      > По сути форума - не по теме выложил в ОСR... - Так вот есть идея попроще Ершовской - наше дело что - книжки в Сети, теоретически неважно, где они будут.. Конечно зеркала Либ.ру и вся система =- неплохая гарнтия от сбоев, но в качестве вспомогательного этапа - можно делать очень - централизованными оставить лишь каталоги, а все, кто что отссканит будут порсто ставить книги куда(и как) смогут(сделать сайт сейчас не проблема) - после этого, они натурально заходят в этот каталог и просто ставят туда название своей книги и ес-но, ейный урл.. Дальшке уже, теоретически, Максим может их себе ставить(с нашего разрешения:), перекодировать в Либформат, но как бы система станет более (в общем-то совсем) открыта, динамична + не надо будет ждать и жаловаться, что кто-то чего не выложил... Механизм каталогов можно сделать даже просто в наборе форумов - по темам... Модерация, конечно нужна...Но можно сделать черновой и чистовой варианты для каждой темы.. Надо пропагандировать во власти е-библ-ки как общенародное достояние:)
     
      Технически эта идея уже рассматривалась мною и делается попытка реализовать ее на практике. Фактически должно иметься несколько online-каталогов, основное назначение которых - хранение каталожной информации, сами книги хранятся на сайтах типа Ершовского и архивах. Получение книги должно выглядеть: читатель делает запрос в один из каталогов (связанных между собой), сервер каталога перенаправляет запрос в подключенные в текущий момент online-библиотеки и ftp-архивы, пользователю выдается набор обнаруженных файлов, либо посылается e-mail'ом сам файл. При отсутствии в online-библиотеках запрос перенаправляется в базовые архивы системы. Ну и плюс утилиты, например, перекодировщики, переформатирование (для этого необходимо некоторая стандартизация описания текста произведения), упаковщики, вьюеры и пр. То есть что-то типа межбиблиотечной системы (МБС) -- читатель может сходить либо непосредственно в библиотеку, либо получить ее через МБС.


446. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:39:50 [ответить]
      > 442. А.
      > По сути форума - не по теме выложил в ОСR... - Так вот есть идея попроще Ершовской - наше дело что - книжки в Сети, теоретически неважно, где они будут.. Конечно зеркала Либ.ру и вся система =- неплохая гарнтия от сбоев, но в качестве вспомогательного этапа - можно делать очень - централизованными оставить лишь каталоги, а все, кто что отссканит будут порсто
     
      Сетевые просто библиотеки и сетевые библиотеки-указатели (содержащие с основном отсылки на другие сайты) делаются технически принципиально по-разному. Тут колоссальная техническая различительная специфика. Приходится выбирать "или-или". Поэтому оставьте в покое уважаемого Максима Евгеньевича, который делает и так свое дело выше всяких похвал. А ненужная головная боль ему совсем ни к чему.


СООБЩЕНИЯ ЗА 06.11.2003
445. А, M 21:24:21 [ответить]
      Предложение - сделать faq по скан-ю и преобразованиям форматов и поставить ссылку на эти 'faq'и вверху страницы(этого форума) на самом видном месте(рядом с ссылкой на Ершова) - чтоб "всяк сюда входящий" для начала при желании мог ознакомиться с передовыми достижениями в области OCR(и не повторять потом уже сказанное)


444. Zhuk, Южный 14:53:57 [ответить]
      все - сам разобрался :)


443. Zhuk, Южный 14:41:53 [ответить]
      ребята, подскажите, в чем дело - когда пытаюсь воспользоваться поиском, кодировка сама меняется и, что не вводи, результат - 0 найденных :( СПАСИБО :)


СООБЩЕНИЯ ЗА 05.11.2003
442. А, Mоscaw 22:42:00 [ответить]
      По сути форума - не по теме выложил в ОСR... - Так вот есть идея попроще Ершовской - наше дело что - книжки в Сети, теоретически неважно, где они будут.. Конечно зеркала Либ.ру и вся система =- неплохая гарнтия от сбоев, но в качестве вспомогательного этапа - можно делать очень - централизованными оставить лишь каталоги, а все, кто что отссканит будут порсто ставить книги куда(и как) смогут(сделать сайт сейчас не проблема) - после этого, они натурально заходят в этот каталог и просто ставят туда название своей книги и ес-но, ейный урл.. Дальшке уже, теоретически, Максим может их себе ставить(с нашего разрешения:), перекодировать в Либформат, но как бы система станет более (в общем-то совсем) открыта, динамична + не надо будет ждать и жаловаться, что кто-то чего не выложил... Механизм каталогов можно сделать даже просто в наборе форумов - по темам... Модерация, конечно нужна...Но можно сделать черновой и чистовой варианты для каждой темы.. Надо пропагандировать во власти е-библ-ки как общенародное достояние:)


СООБЩЕНИЯ ЗА 30.10.2003
441. bmn, Ярославль 08:28:30 [ответить]
      > 439. Максим Мошков.
      > > 438. Zmiy.
      > > > 436. bmn.
      > > > > Zmiy435. .
      > > А куда делось 435 сообщение!?
      >
      > Видимо, bmn жал на "ответить" а попал в "удалить"
      > (Такое и со мной иногда случалось) постинг придется заново заводить - unerase в гостевых я не сделал.
     
      Именно так и получилось. :)) Я жутко извиняюсь...


СООБЩЕНИЯ ЗА 29.10.2003
440. Zmiy, Минск (zmiy@inbox.ru) 11:54:33 [ответить]
      > 439. Максим Мошков.
      > > 438. Zmiy.
      > > > 436. bmn.
      > > > > Zmiy435. .
      > > А куда делось 435 сообщение!?
      >
      > Видимо, bmn жал на "ответить" а попал в "удалить"
      > (Такое и со мной иногда случалось) постинг придется заново заводить - unerase в гостевых я не сделал.
     
      Значит пора на "удалить" поставить запрос "а действительно ли вы хотите удалить"...


439. Максим Мошков, 10:41:39 [ответить]
      > 438. Zmiy.
      > > 436. bmn.
      > > > Zmiy435. .
      > А куда делось 435 сообщение!?
     
      Видимо, bmn жал на "ответить" а попал в "удалить"
      (Такое и со мной иногда случалось) постинг придется заново заводить - unerase в гостевых я не сделал.


СООБЩЕНИЯ ЗА 24.10.2003
438. Zmiy, Минск (zmiy@inbox.ru) 16:59:01 [ответить]
      > 436. bmn.
      > > Zmiy435. .
      > Ты все-таки мне не объяснил, зачем тогда авторы добавляют курсив в свои тексты, если и без него хорошо. :))
     
      А куда делось 435 сообщение!?


437. V.Voblin, 10:46:19 [ответить]
      Ещё о выделении. БЫвают случаи похлеще, чем курсив.
      В одной из книг ерри Пратчета один из героев "разговаривает" специальным шрифтом. Пренебречь этим невозможно, да и не нужно: шрифт существует и широко распространён в виде файла True Type; шрифт можно "утопить" (embed) в файл Word-а вместе с текстом книги, так что его увидит и тот пользователь, у которого фонт не установлен.
     
      Казалось бы, технически должно быть очень несложно "обучить" Файнридер этому фонту, взяв за образец файл True Type. У Файнридера есть средства "обучения", доступные пользователю. Но увы, ничего у меня не получается. Кривое оно какое-то, это обучение. И не фонту, а "язку", а в моём случае язык всё тот же, английский. А я уверен, что нужный вариант обучения существует: не вручную же они "обучали" систему трём-четырём стандартным фонтам, которые Файнридер распознаёт "стандартно".
     
      Может, кто сталкивался с подобной проблемой и нашёл решение?


436. bmn, Ярославль 10:29:08 [ответить]
      > Zmiy435. .
      Ты все-таки мне не объяснил, зачем тогда авторы добавляют курсив в свои тексты, если и без него хорошо. :))


СООБЩЕНИЯ ЗА 23.10.2003
434. bmn, Ярославль 08:23:50 [ответить]
      > Все равно не понимаю, каким макаром смысл текста может зависеть от курсива... Это же не формула, где убрав знаки получится
      Т.е. ты хочешь сказать, что не знаешь о таком понятии, как логическое ударение? И, если следовать твоим мыслям, авторы, вставляющие курсив в свои тексты, просто дураки, которым больше делать нечего? :)))


433. Andrej, Ekaterinburg (tverjakov@mail.ru) 07:46:09 [ответить]
      > 432. Zmiy.
      > > 430. Andrej.
     
     
      > А зачем Вам алгоритм? Есть же готовые программки, которые форматируют текст по ширине...
     
      Алгоритм мне затем, что мне хочется его использовать в макросах на VBA для форматировавания в Ворде (по ряду причин мне так удобнее). Максим Мошков мне его уже прислал, за что ему огромно благодарен!
     
      Вам тоже спасибо за ссылки - попробую и эти утилиты.


СООБЩЕНИЯ ЗА 22.10.2003
432. Zmiy, Минск (zmiy@inbox.ru) 23:55:42 [ответить]
      > 430. Andrej.
      > А-а-а... понятно. Я если и форматирую - то уже готовый текст. На http://www.akapo.narod.ru>http://www.akapo.narod.ru есть хорошая утилитка для форматирования текстовых файлов (txt_lst.exe).
     
     
      Дело не в том, что текст после ФР получается форматирован пробелами по ширине, а в том, что только в этом режиме ФР правильно распознает абзацы и путем несложных операций замены в редакторе можно получить корректный текст, который вставляется в Ворд и обрабатывать дальше...
     
     
      > Кстати , никто не может прислать мне (или здесь выложить) алгоритм форматирования пробелами - все равно: на Бейсике, Паскале, Перле, или просто алгоритм в абстрактном виде. Буду очень благодарен!
      >
      > (А то не очень понятно, какие тут общие принципы, чтобы в итоге красиво выглядело)
     
      А зачем Вам алгоритм? Есть же готовые программки, которые форматируют текст по ширине...
      Вот тут большой набор полезных программок от LLeo:
      http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm
      Из этого набора я раньше пользовался WORD_LST.COM - именно она форматирует текст по ширине...
     
      В крайнем случае попробуйте мою zd2t.exe. Она тоже форматирует текст по ширине... А в комплексе с cltxt.exe можно запросто переформатировать любой текст, у которого абзац выделен хотя бы двумя пробелами. При этом корректно удаляются неубранные переносы слов... Таких текстов с переносами полно и здесь и на fantast2.narod.ru...
     
      Есть еще похожая программка от Славы Алексеева PRK-TEXT.EXE. Ее можно скачать, поискав на ftp-серверах файл PRK-TEXT.HA.


СООБЩЕНИЯ ЗА 23.10.2003
431. Zmiy, Минск (zmiy@inbox.ru) 00:32:59 [ответить]
      > 429. Павел.
      > К вопросу о курсиве. Например, у Фолкнера в "Шуме и яросте" он просто необходим. Без курсива весь смысл ромна теряется. Я очень жалею, что у меня этот текст без курсива и надеюсь, что кто-нибудь все-таки займется восстановлением оного.
     
     
      Все равно не понимаю, каким макаром смысл текста может зависеть от курсива... Это же не формула, где убрав знаки получится белиберда. А текст - это же не набор слов, а связный набор предложений! И смысл потеряется, если только переставить слова в предложениях...


СООБЩЕНИЯ ЗА 22.10.2003
430. Andrej, Ekaterinburg (tverjakov@mail.ru) 17:33:41 [ответить]
      > 427. Zmiy.
      > > 426. Andrej.
     
      > >
      > > То есть как это?!! И 5-й и 6-й ФР распознают курсив (там скорее обратная проблема - иногда выделяют курсивом там, гда выделения нет). А Вы при сохранении используете опцию "Сохранять размер и начертание шрифта" (естественно, сохранять для этого надо в doc или html, а не в txt)?
      >
      > Я понимаю, что курсива не будет в тхт... ;)
      > Но в режиме "Тип страницы = Форматированный пробелами текст" ФР распознает курсив как обычный текст...
     
      А-а-а... понятно. Я если и форматирую - то уже готовый текст. На http://www.akapo.narod.ru>http://www.akapo.narod.ru есть хорошая утилитка для форматирования текстовых файлов (txt_lst.exe).
     
      Кстати , никто не может прислать мне (или здесь выложить) алгоритм форматирования пробелами - все равно: на Бейсике, Паскале, Перле, или просто алгоритм в абстрактном виде. Буду очень благодарен!
     
      (А то не очень понятно, какие тут общие принципы, чтобы в итоге красиво выглядело)


429. Павел, Самара 16:54:54 [ответить]
      К вопросу о курсиве. Например, у Фолкнера в "Шуме и яросте" он просто необходим. Без курсива весь смысл ромна теряется. Я очень жалею, что у меня этот текст без курсива и надеюсь, что кто-нибудь все-таки займется восстановлением оного.


427. Zmiy, Минск (zmiy@inbox.ru) 10:16:54 [ответить]
      > 426. Andrej.
      > > 425. Zmiy.
      > > > 423. Lexa.
      > > > > 421. Zmiy.
      > > > > > 420. Lexa.
      >
      > > Вот делал 2 романа К.Федина и видел В КНИГЕ курсив... и разрядку видел... Но ФР-то распознает все это как обычный текст! Не буду же я ВСЮ (!!!???) книгу пролистывать и построчно искать, где там курсив был...
      >
      > То есть как это?!! И 5-й и 6-й ФР распознают курсив (там скорее обратная проблема - иногда выделяют курсивом там, гда выделения нет). А Вы при сохранении используете опцию "Сохранять размер и начертание шрифта" (естественно, сохранять для этого надо в doc или html, а не в txt)?
     
      Я понимаю, что курсива не будет в тхт... ;)
      Но в режиме "Тип страницы = Форматированный пробелами текст" ФР распознает курсив как обычный текст...


СООБЩЕНИЯ ЗА 21.10.2003
426. Andrej, Ekaterinburg (tverjakov@mail.ru) 08:18:45 [ответить]
      > 425. Zmiy.
      > > 423. Lexa.
      > > > 421. Zmiy.
      > > > > 420. Lexa.
     
      > Вот делал 2 романа К.Федина и видел В КНИГЕ курсив... и разрядку видел... Но ФР-то распознает все это как обычный текст! Не буду же я ВСЮ (!!!???) книгу пролистывать и построчно искать, где там курсив был...
     
      То есть как это?!! И 5-й и 6-й ФР распознают курсив (там скорее обратная проблема - иногда выделяют курсивом там, гда выделения нет). А Вы при сохранении используете опцию "Сохранять размер и начертание шрифта" (естественно, сохранять для этого надо в doc или html, а не в txt)?


425. Zmiy, Минск (zmiy@inbox.ru) 00:22:28 [ответить]
      > 423. Lexa.
      > > 421. Zmiy.
      > > > 420. Lexa.
      > > > Курсив и т.п. внутри текста сохранять по-моему всё-таки нужно.
      > > ...
      > > Никогда такого не видел! В первый раз слышу о таком оформлении мыслей!
      > Не обязательно мыслей. Но приём не настолько редок, а скорее даже довольно часто встречается. В добавление к предыдущему могу также навскидку вспомнить цикл о Владе Талтоше Стивена Браста, Пришествие Ночи Питера Гамильтона.
     
      ПРИЁМ ЭТОТ ОЧЕНЬ РЕДОК !!!
      Вот делал 2 романа К.Федина и видел В КНИГЕ курсив... и разрядку видел... Но ФР-то распознает все это как обычный текст! Не буду же я ВСЮ (!!!???) книгу пролистывать и построчно искать, где там курсив был... Это "мартышкин труд"! Абсолютно бесполезная работа, на которую затрачивается слишком много времени... От этого в романах Н-И-Ч-Е-Г-О не изменится!
      А про "мысли" - обычно мысли идут или отдельными абзацами, или в скобках...


СООБЩЕНИЯ ЗА 20.10.2003
424. Вадим, Москва (chrt-hum@mtu-net.ru) 15:56:06 [ответить]
      > 409. Im Werden.
      > Хочу вернуться к теме "Достоевский - Чейз", >
      > Вспомните, что Букинистические магазины повымерли.
     
      Открылся букинистический магазин на 5-й Кожуховской улице.


423. Lexa, (lexahr@inbox.ru) 13:57:38 [ответить]
      > 421. Zmiy.
      > > 420. Lexa.
      > > Курсив и т.п. внутри текста сохранять по-моему всё-таки нужно. Самый очевидный случай - в диалогах курсивом пишут мысли, т.е. то, что не проговаривается в слух. Например:
      > > - Как я рад тебя видеть! курсивДа чтоб ты сдох!/курсив
      > > При убирании курсива второе предложение в диалоге смотрится несколько странно и имеет совсем не тот смысл, который должен быть.
      >
      > Никогда такого не видел! В первый раз слышу о таком оформлении мыслей!
      Не обязательно мыслей. Но приём не настолько редок, а скорее даже довольно часто встречается. В добавление к предыдущему могу также навскидку вспомнить цикл о Владе Талтоше Стивена Браста, Пришествие Ночи Питера Гамильтона.


422. Steex, Минск (sot_sub@tut.by) 00:29:49 [ответить]
      > 421. Zmiy.
      > > 420. Lexa.
      > > Курсив и т.п. внутри текста сохранять по-моему всё-таки нужно. Самый очевидный случай - в диалогах курсивом пишут мысли, т.е. то, что не проговаривается в слух. Например:
      > > - Как я рад тебя видеть! курсивДа чтоб ты сдох!/курсив
      > > При убирании курсива второе предложение в диалоге смотрится несколько странно и имеет совсем не тот смысл, который должен быть.
      >
      > Никогда такого не видел! В первый раз слышу о таком оформлении мыслей!
     
     
      Примеры навскидку:
      - Клиффорд Саймак. Что может быть проще времени?
      - Сергей Лукьяненко. Звезды - холодные игрушки.
      - Конан Дойл. Случай с переводчиком.
     
      Кроме того, часто курсив имеет тот же смысл, что и кавычки. Часто курсив или разрядка используется для изменения смысла или смыслового оттенка слова, для выделения его в предложении... да мало ли еще для чего! Вне всяких сомнений, если автор произведения выделил часть текста (курсивом, разрядкой, подчеркиванием etc.), стало быть, он считал, что это важно для понимания его замысла. Уничтожение такого форматирования равносильно искажению текста.


СООБЩЕНИЯ ЗА 19.10.2003
421. Zmiy, Минск (zmiy@inbox.ru) 23:52:05 [ответить]
      > 420. Lexa.
      > Курсив и т.п. внутри текста сохранять по-моему всё-таки нужно. Самый очевидный случай - в диалогах курсивом пишут мысли, т.е. то, что не проговаривается в слух. Например:
      > - Как я рад тебя видеть! курсивДа чтоб ты сдох!/курсив
      > При убирании курсива второе предложение в диалоге смотрится несколько странно и имеет совсем не тот смысл, который должен быть.
     
      Никогда такого не видел! В первый раз слышу о таком оформлении мыслей!


420. Lexa, (lexahr@inbox.ru) 23:48:45 [ответить]
      Курсив и т.п. внутри текста сохранять по-моему всё-таки нужно. Самый очевидный случай - в диалогах курсивом пишут мысли, т.е. то, что не проговаривается в слух. Например:
      - Как я рад тебя видеть! курсивДа чтоб ты сдох!/курсив
      При убирании курсива второе предложение в диалоге смотрится несколько странно и имеет совсем не тот смысл, который должен быть.


419. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 00:39:30 [ответить]
      > 416. Andrej.
      > > 414. Вячеслав Сачков.
      >
      > PGP чуть-ли не на каждом втором FTP лежит :))
      О том, что такое PGP, мне лет 6 назад исчерпывающе растолковала любезная девушка Marinais. Пользоваться им отнюдь не убедила, ибо я ленив, а в фидо лень лень почитается за достоинство как первичный двигатель прогресса. Но рядовые текстовые производственники (их было и будет большинство), вчера приобщившиеся к сети, а сегодня выложившие в нее тексты, вне всякого сомнения, ничего подобного делать не будут, но в этом-то именно и вопрос.
      >
      > > А в этом предложении что-то есть. Только тут есть большой риск коммерциализации. Пока это может делаться по принципу фидо, все нормально. А когда объемы возрастут критически и критически повысятся требования обеспечения сохранности, когда соответствующим образом затраты возрастут, будет проблема.
      >
      > Без государства, имхо, не обойтись. Т.е., скажем Академия наук входит с соответствующим предлжением в правительство, то принимает решение и т.д. А пока этого нет (и, очевидно, не скоро будет) - электронные тексты годятся только для самообразования, а не для научной работы.
     
      Тогда все - безнадежно, как в произошедшем после августа 1991 г. случае со сбербанками.


418. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 00:21:20 [ответить]
      > 415. Andrej.
      > > 414. Вячеслав Сачков.
      > > Но если Иванов доступен только в электронной версии, то следует указать, что - Цит. по: электронный файл такой-то.
      >
      Ключевое слово "только". Тексты, имеющиеся только в электронном виде в настоящее время представляют собой огромное исключение. А Электронных версий одних и тех же бумажных версий сейчас, наоборот, достаточно большое количество.
      > А как это сделать? Сегодня можно только урл указать. И полбеды, если через год по этому урлу вообще ничего не окажется, гораздо хуже, если окажется другой файл, переделанный.
      >
      Согласитесь, что предположенные Вами случаи тупиковы. Типа никто ни в чем не виноват и взятки гладки. Ответственность с цитирововавшего снята, но в это ли действительная проблема?
      > >Конечно, в принципе, такие изыски могут быть, т.е. исключить их абсолютно полностью невозможно, но, во-первых, такое возможно как в высшей степени редкие случаи, во-вторых, тут многое определяется опытом цитирующего обращаться с сетевыми текстами. Я лично прекрасно знаю, где у кого какое качество (в пределах того, чем интересуюсь, конечно) и с соответствующей степенью осторожности к соответствующим текстам отношусь.
      >
      > Но это Ваш субъективный выбор, основанный на Ваших субъективных оценках качества, которые вовсе не есть истина в последней инстанции. И если Вы пишите монографию - то ее читатели должны быть с этим Вашим выбором ознакомлены, а не вводиться в заблуждение по поводу реального источника цитат.
      >
      Т.е., если я Вас правильно понял, Вы предлагаемой Вами процедурой хотите четко определить "крайнего" на случи ляпов. Правомерно, по-моему, ставите вопрос.
      >
     
      > > Если так слишком грустно на вещи смотреть, то с этим делом надо вообще завязывать, кончать компы для тиражирования текстов использовать и снова на бумажные форматы отползать.
      >
      > Ну почему же? Монографии и статьи нужны ведь не только для написания новых монографий и статей, а прежде всего - как источник знаний.
      >
      К сожалению, например, история как ремесло на 99% состоит из переписывания, цитирования того, что кем-то раньше было уже написано.На остальное отводится максимум 1 процент.
      >
      > >Практически же, выполняя разную писательскую работу, народ теперь в огромном преимуществе имеет дело не с бумагой, а с экраном. В такой ситуации о файлах поминать все равно, что фиговым листочком прикрываться.
      >
      > И тем самым ставят на карту свою репутацию. До поры до времени все может сходить рук, но всегда остается риск однажды сесть в большую и очень грязную лужу.
      >
      Дык это и вир за милую душу может натворить. Волков бояться - не ходить в лес.


СООБЩЕНИЯ ЗА 18.10.2003
417. Настя, Москва (Kkatze@yandex.ru) 18:13:44 [ответить]
      Крайне необходим Гальперин


416. Andrej, Ekaterinburg (tverjakov@mail.ru) 09:55:06 [ответить]
      > 414. Вячеслав Сачков.
      > > 408. Andrej.
      > > > 407. Вячеслав Сачков.
     
      Продолжение предыдущего постинга:
     
      > > 2). Наличие цифровой подписи, гарантирующей аутентичность файла.
      > >
      > А что такое цифровая подпись и с чем ее едят? ;-) Рекомендовать имеет смысл то, что элементарно повсеместно воспроизводимо.
     
      А какие проблемы с воспроизводимостью цифровой подписи? :о)
     
      PGP чуть-ли не на каждом втором FTP лежит :))
     
      Речь ведь не идет о сертифицированной государством цифровой подписи для финансовых или юридических документов, а просто о технологии достаточной надежной и авторитетной, чтобы быть принятой научным сообществом.
     
      PGP, имхо, подходит по всем статьям. Другой разговор, что опять-таки нужна надежная система депонирования открытых ключей, потому что нынешняя больше ориентирована на текущую переписку, а не на долговременное хранение электронных документов.
     
      > А в этом предложении что-то есть. Только тут есть большой риск коммерциализации. Пока это может делаться по принципу фидо, все нормально. А когда объемы возрастут критически и критически повысятся требования обеспечения сохранности, когда соответствующим образом затраты возрастут, будет проблема.
     
      Без государства, имхо, не обойтись. Т.е., скажем Академия наук входит с соответствующим предлжением в правительство, то принимает решение и т.д. А пока этого нет (и, очевидно, не скоро будет) - электронные тексты годятся только для самообразования, а не для научной работы.


415. Andrej, Ekaterinburg (tverjakov@mail.ru) 09:53:18 [ответить]
      > 414. Вячеслав Сачков.
      > > 408. Andrej.
      > > > 407. Вячеслав Сачков.
     
      > Умеючи злонамеренно курсив удалить можно и в "бумажной" книге. ;-)
     
      Кто ж спорит, конечно можно. Особенно, если книга выпущена каким-нибудь кооперативом "Тяп-ляп" в конце 80-х :))
     
      Но речь-то о другом. Когда кто-то ссылается на бумажную книгу - он ссылается на _конкретное_ издание со всеми его ошибками. И наличие или отсутствие ошибок относится к существу его научной работы, а не к техническим формальным правилам (но тем не менее очень важным), о которых здесь речь.
     
      Представьте, что кто-то хочет процитировать сочинение Иванова, которое ему недоступно в силу редкости. Зато доступна мография Сидорова, в которой Иванов цитируется. Он же не будет в сноске указывать: Иванов, 1804; а укажет: Цит. по: Сидоров,1904. И сделает это, даже если авторитет Сидорова бесспорен, и нет никаких оснований предполагать, что тот исказил Иванова в своих цитатах.
     
      Но если Иванов доступен только в электронной версии, то следует указать, что - Цит. по: электронный файл такой-то.
     
      А как это сделать? Сегодня можно только урл указать. И полбеды, если через год по этому урлу вообще ничего не окажется, гораздо хуже, если окажется другой файл, переделанный.
     
      > Конечно, в принципе, такие изыски могут быть, т.е. исключить их абсолютно полностью невозможно, но, во-первых, такое возможно как в высшей степени редкие случаи, во-вторых, тут многое определяется опытом цитирующего обращаться с сетевыми текстами. Я лично прекрасно знаю, где у кого какое качество (в пределах того, чем интересуюсь, конечно) и с соответствующей степенью осторожности к соответствующим текстам отношусь.
     
      Но это Ваш субъективный выбор, основанный на Ваших субъективных оценках качества, которые вовсе не есть истина в последней инстанции. И если Вы пишите монографию - то ее читатели должны быть с этим Вашим выбором ознакомлены, а не вводиться в заблуждение по поводу реального источника цитат.
     
     
      > Если так слишком грустно на вещи смотреть, то с этим делом надо вообще завязывать, кончать компы для тиражирования текстов использовать и снова на бумажные форматы отползать.
     
      Ну почему же? Монографии и статьи нужны ведь не только для написания новых монографий и статей, а прежде всего - как источник знаний.
     
     
      > Практически же, выполняя разную писательскую работу, народ теперь в огромном преимуществе имеет дело не с бумагой, а с экраном. В такой ситуации о файлах поминать все равно, что фиговым листочком прикрываться.
     
      И тем самым ставят на карту свою репутацию. До поры до времени все может сходить рук, но всегда остается риск однажды сесть в большую и очень грязную лужу.
     
      Возвращаясь к теме: стоит ли кропотливо проставлять страницы, только для того, чтобы провоцировать недобросовестность и вводить научных работников в соблазн? Имхо, не стоит. Но это, разумеется, сугубо мое имхо. В общем-то, наличие страниц при чтении лично мне не мешает.
     
      > > 2). Наличие цифровой подписи, гарантирующей аутентичность файл


414. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 05:35:12 [ответить]
      > 408. Andrej.
      > > 407. Вячеслав Сачков.
      > >А в науной литературе, используемой для цитирования, безусловно. необходимо. Так я считаю.
      >
      > А вот это, имхо, спорно. Если кто-то ссылается на _бумажную_книгу_, используя для этой цели _электронный_файл_ - то это, имхо, просто-напросто научная недобросовестность. Потому что неизвестно, насколько этот файл адекватно воспроизводит книгу - а может сканировщик курсив поудалял или еще что-нибудь переделал, да "забыл" об этом предупредить?
      >
      Умеючи злонамеренно курсив удалить можно и в "бумажной" книге. ;-) Конечно, в принципе, такие изыски могут быть, т.е. исключить их абсолютно полностью невозможно, но, во-первых, такое возможно как в высшей степени редкие случаи, во-вторых, тут многое определяется опытом цитирующего обращаться с сетевыми текстами. Я лично прекрасно знаю, где у кого какое качество (в пределах того, чем интересуюсь, конечно) и с соответствующей степенью осторожности к соответствующим текстам отношусь. Тут чаще по опыту другие вещи бывают, - когда, например, число номера страницы за дату в тексте принимают. Здесь как-то один такой произошедший случай обсуждался. Но в общем искажения при цитировании электронных текстов по сравнению с "бумажными", пожалуй, если и больше вообще, то совсем ненамного.
      > Имхо, используя файл - на этот файл только и можно ссылаться, а не на исходное издание. А здесь, конечно, встают вопросы - каким критериям файл должен соответствовать, чтобы на него _можно_ было ссылаться. Но страницы здесь явно ни при чем.
      >
      Если так слишком грустно на вещи смотреть, то с этим делом надо вообще завязывать, кончать компы для тиражирования текстов использовать и снова на бумажные форматы отползать. Практически же, выполняя разную писательскую работу, народ теперь в огромном преимуществе имеет дело не с бумагой, а с экраном. В такой ситуации о файлах поминать все равно, что фиговым листочком прикрываться.
      > На мой взгляд, должны выполняться три условия:
      >
      > 1). Наличие неких атрибутов, позволяющих однозначно идентифицировать файл - кем создан (электронный "издатель"), дата создания, номер версии и т.д.
      >
      Есть вообще такой вопрос, но к обсуждаемому нами здесь теперь он прямо не относится, т.е. в данном контексте он не актуален.
      > 2). Наличие цифровой подписи, гарантирующей аутентичность файла.
      >
      А что такое цифровая подпись и с чем ее едят? ;-) Рекомендовать имеет смысл то, что элементарно повсеместно воспроизводимо.
      > 3) Наличие неких авторитетных (для научного сообщества) систем депонирования файлов, гарантирующих их сохранность и обеспечивающих к ним доступ исследователей (не обязательно онлайновый).
      >
      А в этом предложении что-то есть. Только тут есть большой риск коммерциализации. Пока это может делаться по принципу фидо, все нормально. А когда объемы возрастут критически и критически повысятся требования обеспечения сохранности, когда соответствующим образом затраты возрастут, будет проблема.
      > А без соблюдения этих (и, возможно,


СООБЩЕНИЯ ЗА 17.10.2003
413. sinclair, Москва 16:08:18 [ответить]
      > 409. Im Werden.
      > Хочу вернуться к теме "Достоевский - Чейз"
      > ....
      > Давайте сканировать и выкладывать прежде всего НЕ ПОПУЛЯРНУЮ, но очень НУЖНУЮ литературу, найти которую в книжных магазинах не возможно....
     
     
      Сканируйте, пожалуйста, ЛЮБУЮ литературу, по ВАШИМ интересам и мнениям.
      Главное, чтоб её до Вас не было в Рунете.
      Это есть основной и главный и единственный критерий.
      Понимаете, Вы--первопечатники...вроде так.


Continue