Она распознает оба? Я имею в виду русский и латинские названия? Спрашиваю потому, что с этим раньше были серьезные проблемы.
СКАНИРОВАНИЕ КНИГ
Сообщений 101 страница 120 из 145
Поделиться1022010-09-24 00:55:12
Она распознает оба? Я имею в виду русский и латинские названия? Спрашиваю потому, что с этим раньше были серьезные проблемы
- да распознает и русский и латинский, но потом нужна ручная правка, - хотя ощибки случаются редко.
Поделиться1032010-10-19 12:46:46
Добрый день участникам форума!
Случайно обнаружил данный форум через Яндекс, решил зайти пообщаться.
У меня как раз свой сайт по вопросам сканирования бумажных книг в DjVu - http://www.djvu-soft.narod.ru/ .
Но меня очень напрягают разноцветные страницы. Нет ли технологии, чтобы сканируя страницу, для цв фото и илл - задавать один профиль, а для ч/б текстов - другой.
Как раз позавчера я обновил свою статью "Использование DjVu Imager" http://www.djvu-soft.narod.ru/scan/djvu_imager.htm - там чётко и подробно расписан процесс оптимального кодирования в DjVu сканов, содержащих текст и иллюстрации одновременно (при этом текст и иллюстрации кодируются раздельно и наиболее оптимальными профилями для них).
Поделиться1042010-10-19 12:57:14
Форум -- это ключ к успеху. Так у меня вышло и с малакологами, и с микологами. Только с альгологами ничего поделать не могу. Так что Вы -- на правильном пути. Только форуму надо расти года два. А пока форум надо продвигать и продвигать. У меня есть пара идей, если хотите.
У меня тоже когда-то стояла такая дилемма - как привлечь народ к сканированию книг. Причём именно к тематическому. Меня интересовала такая строительная специальность как "Отопление, вертиляция и кондиционирование". В тот момент в Интернете не было вообще ни одной DjVu-книги на эту тему.
Действительно, помог тематический форум ( http://forum.abok.ru/index.php?showforum=23 ). Я первый начал сканировать и выкладывать там DjVu-книги из этой области. Тут же начали появляться ещё и другие книгосканировщики - по той же теме.
С той поры прошло несколько лет. Теперь процесс сканирования книг на том форуме обрёл характер постоянного мощного потока (со множеством участников).
Форум - это действительно сильный инструмент. Практика показывает, что многие люди не прочь сканировать книги (любители, конечно) - просто они не знают, как это делается, или не верят в реалистичность этого занятия. Если им показать пример - и что-то подсказать - то дело обязательно пойдёт на лад.
Небольшой момент: я лично пользуюсь файлообменником ifolder.ru . Он хорош тем, что файлы, туда закаченные, потом никогда не стираются с сервера - а только через 30 дней помещаются в архив (откуда их всегда можно сказать). Плюс высокая скорость скачивания и наличие удалённой закачки (можно напрямую с других файлообменников туда перекачивать).
Поделиться1052010-10-19 13:42:29
Добрый день участникам форума!
Случайно обнаружил данный форум через Яндекс, решил зайти пообщаться.
У меня как раз свой сайт по вопросам сканирования бумажных книг в DjVu - http://www.djvu-soft.narod.ru/ .
xguar написал(а):
Но меня очень напрягают разноцветные страницы. Нет ли технологии, чтобы сканируя страницу, для цв фото и илл - задавать один профиль, а для ч/б текстов - другой.Как раз позавчера я обновил свою статью "Использование DjVu Imager" http://www.djvu-soft.narod.ru/scan/djvu_imager.htm - там чётко и подробно расписан процесс оптимального кодирования в DjVu сканов, содержащих текст и иллюстрации одновременно (при этом текст и иллюстрации кодируются раздельно и наиболее оптимальными профилями для них).
http://www.djvu-soft.narod.ru/
Здраствуйте!
Спасибо за статью, написана грамотно и понятно
Поделиться1062010-10-19 13:47:26
С той поры прошло несколько лет. Теперь процесс сканирования книг на том форуме обрёл характер постоянного мощного потока (со множеством участников).
У нас с точностью наоборот, не только на форуме но и в рунете, все заглохло
Небольшой момент: я лично пользуюсь файлообменником ifolder.ru . Он хорош тем, что файлы, туда закаченные, потом никогда не стираются с сервера - а только через 30 дней помещаются в архив (откуда их всегда можно сказать). Плюс высокая скорость скачивания и наличие удалённой закачки (можно напрямую с других файлообменников туда перекачивать).
За этот файлообменник мне мозги компосируют уже несколько лет.
и файлы не хранятся там вечно, их удаляют через некоторое время из архива
Поделиться1072010-10-19 15:11:00
Zoometod
Спасибо за статью, написана грамотно и понятно
Прошу обратить внимание - статья в общем-то уже существует давно - но изначально она содержала лишь описание работы метода через ScanKromsator. И лишь на днях я добавил туда описание работы метода через Scan Tailor - и это существенный момент.
За этот файлообменник мне мозги компосируют уже несколько лет.
и файлы не хранятся там вечно, их удаляют через некоторое время из архива
Интересно - через какой срок из оттуда удаляют? Я вот пока не сталкивался с удалением.
Конечно, файлообменники - не лучшее. Есть и такой черновой вариант, как сайт на Narod.ru. Там можно разрезать большие файлы на куски по 5 МБ - и в таком виде выложить. Пример - сайт umup.narod.ru. Это, конечно, очень неудобно для пользователей - но зато бесплатно и гарантированно будет вечно жить. А файлы до 5 МБ - так вообще напрямую там можно хранить.
Ещё вариант - заливка DjVu-книг в большие библиотеки. Например, вот тут можно попробовать: http://free-books.dontexist.com/ (не знаю, работает ли это сейчас).
Лучше бы конечно Вашему сообществу скинуться и купить себе хостинг - и туда всё выложить (DjVu и PDF). Накладно, конечно - но практика показывает, что именно к такому варианту народ в таких ситуациях обычно и приходит. Может, с кем-нибудь объединитесь на этой почве. Файлообменники - это в конечном итоге сложнее выходит и ненадёжнее.
У нас с точностью наоборот, не только на форуме но и в рунете, все заглохло
Видимо, у Вас более экзотическая отрасль. Но тут всё зависит от количества приложенного труда (то есть в плане агитации потенциальных сканировщиков). У меня-то тоже всё шло весьма негладко - понадобились годы и усилия, чтобы народ "созрел". Усилия - разного плана, начиная от личного примера и заканчивая поиском сторонников на аналогичных форумах (где книги сканируют).
Поделиться1082010-10-19 15:23:29
То есть используя эту прогу можно и сканировать в DJVU и просто сканировать?
Я до конца не разобрался ещё с этим процессом. Пока предпочитал цв илл сканировать утилитой к сканеру, а ч/б и серые FineRiderom (слышал, что последний способ имеет существенные недостатки).
Вообще общепринятая методика сканирования книг находится тут:
http://www.djvu-soft.narod.ru/scan/scan … e_1_07.htm
Но она значительно уже устарела. Надо писать новую. В 2-х словах я её не смогу описать.
Могу лишь посоветовать пока что заглянуть сюда: "Как самому сделать DjVu-книгу (Краткая схема)"
Поделиться1092010-10-19 15:26:32
Если покупать, то только Plustek OptiBook
Не всё так однозначно. Народ жалуется - примерно через 3 года работы у этого сканера (Plustek OptiсBook 3600) "летит" лампа подсветки сканирования. А новая стоит от 50 до 150 долларов (т.е. от 15 до 50% стоимости сканера) - плюс хлопоты по пересылке почтой. И заменить её нечем - лампа-то изогнутая буквой "П".
Отредактировано monday2000 (2010-10-19 15:27:24)
Поделиться1102010-10-19 15:39:28
Как добиться, например, чтобы все страницы были одинакового размера (обложка желательно также) с минимальным значением поля, заданном в соответствующем месте, текст распологался как в оригинале и обработку при этом осуществлять за 1 сеанс?
Взять Scan Tailor. В ScanKromsator, конечно, тоже страницы обычно получаются одинакового размера - просто ScanKromsator - это программа "не для новичков" - а Scan Tailor - как раз наоборот. Если Вам нужно освоить именно ScanKromsator - тогда могу предложить "Пособие по Кромсатору" http://www.djvu-soft.narod.ru/kromsator/ .
Ещё лучше, чтобы для соответствующего типа сканов, сразу задавать бы профиль соответствующий... (я конечно задал один, но что-то сомневаюсь, что им можно пользоваться без оглядки)
Да, вот как раз для сканов с полутоновыми иллюстрациями и используется методика http://www.djvu-soft.narod.ru/scan/djvu_imager.htm - где как раз задаётся каждому виду контента свой профиль DjVu-кодирования.
Кое-что у меня получилось, но не совсем так, как хотелось бы и уж больно геморройный процесс....
Да, к сожалению, несмотря на все усилия, желаемой простоты в произодстве DjVu пока достичь не удалось. К примеру, этап облагораживания сырых сканов (перед дежавючением) по-прежнему требует использования 3-х программ (в общем случае) - это ScanKromsator, Scan Tailor и Book Restorer. Хотелось бы иметь вместо этой троицы одну универсальную программу - но пока по разным причинам не получается.
Поделиться1112010-10-19 15:53:35
Насущный вопрос:
Как побороть нежелание людей сканировать книги?
Основные отмазки:
Я не умею
У меня нет времени
Как мне кажется, этой цели можно добиться. Однако, это тонкая и деликатная задача. И ещё - очень, так сказать, "инерционная". Нужно сначала приложить уйму усилий (и в более-менее правильном направлении) - прежде чем народ начнёт сканировать.
Чтобы народ начал сканировать - нужно провести своего рода "рекламную кампанию" - и вложить в это изрядную толику своих усилий любого плана. Как говорится, "нужно очень захотеть" - и тогда со временем Ваше желание как бы передастся окружающим (мне так кажется). Без изрядных усилий дело не пойдёт, пожалуй.
Поделиться1122010-10-19 15:56:51
А натуралисты походу вымерли вместе с СССР.
Да, это существенная проблема. Но всё-таки хоть 2-3 человека-то найдётся - а 2-3 человека - это уже изрядная "книгосканировочная" сила (при условии, что они регулярно сканируют). Студенты-биологи - вот где можно поискать (а лучше всего - аспиранты-биологи, собирающиеся защищаться - и имеющие "подневольных" студентов - потенциальных сканировщиков - вот кому DjVu-литература жизненно необходима).
Отредактировано monday2000 (2010-10-19 15:57:50)
Поделиться1132010-10-19 19:55:56
Интересно - через какой срок из оттуда удаляют? Я вот пока не сталкивался с удалением.
думаю в архиве лежит не больше месяца, если не будет скачиваний с архива.
Поделиться1142010-10-19 21:54:26
Лучше бы конечно Вашему сообществу скинуться и купить себе хостинг - и туда всё выложить
хостинг есть, аж целых три, только не у меня а у хрошего знакомого m7876 который размещает все биологические книги на своих сайтах и в огромных количествах сканирует книги
Поделиться1152010-10-19 21:56:16
Студенты-биологи - вот где можно поискать (а лучше всего - аспиранты-биологи, собирающиеся защищаться - и имеющие "подневольных" студентов - потенциальных сканировщиков - вот кому DjVu-литература жизненно необходима).
эти только попрошайничать могут книги из обменного фонда.
Много сканов на руках у ученых, только они делиться не спешат.
Специально создал обменный фонд чтоб стимулировать сканированние, только много пользы от этого нет
Поделиться1162010-10-19 22:02:01
у меня была идея замутить взаимовыгодное сотрудничество со сканировщиками других областей знаний, (я сканирую их интересующие книги, они меня интересующие) только из этого думаю ничего не выйдет, народ не подхватит и мне одному придется расхлебываться
Поделиться1172010-10-20 04:21:57
monday2000
спасибо, только все приведённые вопросы уже решены...
Лично у меня (кроме отсутствия денег на новое оборудование) никаких проблем нет уже почти год
Поделиться1182010-10-20 09:51:06
хостинг есть, аж целых три,
Да я имею в виду не просто хостинг - а большой хостинг - на 5-10 ГБ - где DjVu-книги выложены непосредственно там. По крайней мере, на http://www.zoomet.ru , куда ни посмотри - все книги лежат на файлообменниках - а не на самом zoomet.ru. Кстати - а какие ещё у Вас есть хостинги с книгами, кроме zoomet.ru?
у меня была идея замутить взаимовыгодное сотрудничество со сканировщиками других областей знаний, (я сканирую их интересующие книги, они меня интересующие)
Едва ли тут возможна такая прямая договоренность. Это же не товарно-денежные отношения. На мой взгляд, метод обмена "книга на книгу" не очень эффективен - мне кажется, свободный взаимообмен предпочтительнее. Да и сканировщикам из других областей знания Ваша область вряд ли интересна. Наверное, нужно развивать свою область.
Есть ещё один вариант, куда класть книги. Правда, немного сомнительный - но я им уже года 2 пользуюсь более-менее успешно. Это почтовый ящик nextmail.ru - там при ящике даётся файловое хранилище 2 ГБ с максимальным размером файла 50 МБ. Всё, что нужно - хотя бы раз в 4 месяца ( http://nextmail.ru/ovr/agreement.phtml?t=2 ) зайти в ящик хотя бы раз - чтобы файлы не стёрлись. Немного неудобно - но всё же реально. А можно, по идее, на своём платном хостинге написать PHP-скрипт, который будет автоматически периодически заходить в ящик nextmail. Правда, были в прошлом случаи, когда с nextmail по неизвестной причине пропадали все файлы. Они объясняли это сбоями оборудования. Но вот где-то год назад они переработали свою систему - и с тех пор тьфу-тьфу - ни единого сбоя.
Отредактировано monday2000 (2010-10-20 11:07:04)
Поделиться1192010-10-24 22:13:53
Интересно какой у кого сканер
А у меня МФУ HP F2483, с очень удобным, на мой взгляд, программным обеспечением.
Правда сканированием книг полностью не занимался, только отдельные главы, с наиболее ценным для меня материалом, хранил их в в виде "сканированное изображение" с расширением .jpg в отдельных папках по названию глав, а уже эти папки вкладывал в папку с названием книги. Вот такая вот технология. Не очень-то и удобно...
Хочу освоить Вашу методику сканирования книг, тогда может быть смогу чем-то помочь
Поделиться1202010-10-28 19:02:23
Да я имею в виду не просто хостинг - а большой хостинг - на 5-10 ГБ - где DjVu-книги выложены непосредственно там. По крайней мере, на http://www.zoomet.ru , куда ни посмотри - все книги лежат на файлообменниках - а не на самом zoomet.ru. Кстати - а какие ещё у Вас есть хостинги с книгами, кроме zoomet.ru?
http://ashipunov.info/shipunov/school/sch-ru.htm
http://herba.msu.ru/shipunov/school/sch-ru.htm