БИОЛОГИЧЕСКИЙ ФОРУМ ЭЛЕКТРОННОЙ БИОЛОГИЧЕСКОЙ БИБЛИОТЕКИ ZOOMET.RU

БИОЛОГИЧЕСКИЙ ФОРУМ

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » БИОЛОГИЧЕСКИЙ ФОРУМ » ЭЛЕКТРОННАЯ ЛИТЕРАТУРА » СКАНИРОВАНИЕ КНИГ


СКАНИРОВАНИЕ КНИГ

Сообщений 101 страница 120 из 145

101

Она распознает оба? Я имею в виду русский и латинские названия? Спрашиваю потому, что с этим раньше были серьезные проблемы.

102

Она распознает оба? Я имею в виду русский и латинские названия? Спрашиваю потому, что с этим раньше были серьезные проблемы

- да распознает и русский и латинский, но  потом нужна ручная правка, - хотя ощибки случаются редко.

103

Добрый день участникам форума!
Случайно обнаружил данный форум через Яндекс, решил зайти пообщаться.

У меня как раз свой сайт по вопросам сканирования бумажных книг в DjVu - http://www.djvu-soft.narod.ru/ .

xguar написал(а):

Но меня очень напрягают разноцветные страницы. Нет ли технологии, чтобы сканируя страницу, для цв фото и илл - задавать один профиль, а для ч/б текстов - другой.

Как раз позавчера я обновил свою статью "Использование DjVu Imager" http://www.djvu-soft.narod.ru/scan/djvu_imager.htm - там чётко и подробно расписан процесс оптимального кодирования в DjVu сканов, содержащих текст и иллюстрации одновременно (при этом текст и иллюстрации кодируются раздельно и наиболее оптимальными профилями для них).

104

m7876 написал(а):

Форум -- это ключ к успеху. Так у меня вышло и с малакологами, и с микологами. Только с альгологами ничего поделать не могу. Так что Вы -- на правильном пути. Только форуму надо расти года два. А пока форум надо продвигать и продвигать. У меня есть пара идей, если хотите.

У меня тоже когда-то стояла такая дилемма - как привлечь народ к сканированию книг. Причём именно к тематическому. Меня интересовала такая строительная специальность как "Отопление, вертиляция и кондиционирование". В тот момент в Интернете не было вообще ни одной DjVu-книги на эту тему.

Действительно, помог тематический форум ( http://forum.abok.ru/index.php?showforum=23 ). Я первый начал сканировать и выкладывать там DjVu-книги из этой области. Тут же начали появляться ещё и другие книгосканировщики - по той же теме.

С той поры прошло несколько лет. Теперь процесс сканирования книг на том форуме обрёл характер постоянного мощного потока (со множеством участников).

Форум - это действительно сильный инструмент. Практика показывает, что многие люди не прочь сканировать книги (любители, конечно) - просто они не знают, как это делается, или не верят в реалистичность этого занятия. Если им показать пример - и что-то подсказать - то дело обязательно пойдёт на лад.

Небольшой момент: я лично пользуюсь файлообменником ifolder.ru . Он хорош тем, что файлы, туда закаченные, потом никогда не стираются с сервера - а только через 30 дней помещаются в архив (откуда их всегда можно сказать). Плюс высокая скорость скачивания и наличие удалённой закачки (можно напрямую с других файлообменников туда перекачивать).

105

monday2000 написал(а):

Добрый день участникам форума!
Случайно обнаружил данный форум через Яндекс, решил зайти пообщаться.
У меня как раз свой сайт по вопросам сканирования бумажных книг в DjVu - http://www.djvu-soft.narod.ru/ .
xguar написал(а):
Но меня очень напрягают разноцветные страницы. Нет ли технологии, чтобы сканируя страницу, для цв фото и илл - задавать один профиль, а для ч/б текстов - другой.Как раз позавчера я обновил свою статью "Использование DjVu Imager" http://www.djvu-soft.narod.ru/scan/djvu_imager.htm - там чётко и подробно расписан процесс оптимального кодирования в DjVu сканов, содержащих текст и иллюстрации одновременно (при этом текст и иллюстрации кодируются раздельно и наиболее оптимальными профилями для них).
http://www.djvu-soft.narod.ru/

Здраствуйте!

Спасибо за статью, написана грамотно и понятно

106

monday2000 написал(а):

С той поры прошло несколько лет. Теперь процесс сканирования книг на том форуме обрёл характер постоянного мощного потока (со множеством участников).

У нас с точностью наоборот, не только на форуме но и в рунете, все заглохло

monday2000 написал(а):

Небольшой момент: я лично пользуюсь файлообменником ifolder.ru . Он хорош тем, что файлы, туда закаченные, потом никогда не стираются с сервера - а только через 30 дней помещаются в архив (откуда их всегда можно сказать). Плюс высокая скорость скачивания и наличие удалённой закачки (можно напрямую с других файлообменников туда перекачивать).

За этот файлообменник мне мозги компосируют уже несколько лет.

и файлы не хранятся там вечно, их удаляют через некоторое время из архива

107

Zoometod

Спасибо за статью, написана грамотно и понятно

Прошу обратить внимание - статья в общем-то уже существует давно - но изначально она содержала лишь описание работы метода через ScanKromsator. И лишь на днях я добавил туда описание работы метода через Scan Tailor - и это существенный момент.

За этот файлообменник мне мозги компосируют уже несколько лет.
и файлы не хранятся там вечно, их удаляют через некоторое время из архива

Интересно - через какой срок из оттуда удаляют? Я вот пока не сталкивался с удалением.

Конечно, файлообменники - не лучшее. Есть и такой черновой вариант, как сайт на Narod.ru. Там можно разрезать большие файлы на куски по 5 МБ - и в таком виде выложить. Пример - сайт umup.narod.ru. Это, конечно, очень неудобно для пользователей - но зато бесплатно и гарантированно будет вечно жить. А файлы до 5 МБ - так вообще напрямую там можно хранить.

Ещё вариант - заливка DjVu-книг в большие библиотеки. Например, вот тут можно попробовать: http://free-books.dontexist.com/ (не знаю, работает ли это сейчас).

Лучше бы конечно Вашему сообществу скинуться и купить себе хостинг - и туда всё выложить (DjVu и PDF). Накладно, конечно - но практика показывает, что именно к такому варианту народ в таких ситуациях обычно и приходит. Может, с кем-нибудь объединитесь на этой почве. Файлообменники - это в конечном итоге сложнее выходит и ненадёжнее.

У нас с точностью наоборот, не только на форуме но и в рунете, все заглохло

Видимо, у Вас более экзотическая отрасль. Но тут всё зависит от количества приложенного труда (то есть в плане агитации потенциальных сканировщиков). У меня-то тоже всё шло весьма негладко - понадобились годы и усилия, чтобы народ "созрел". Усилия - разного плана, начиная от личного примера и заканчивая поиском сторонников на аналогичных форумах (где книги сканируют).

108

xguar написал(а):

То есть используя эту прогу можно и сканировать в DJVU и просто сканировать?
Я до конца не разобрался ещё с этим процессом. Пока предпочитал цв илл сканировать утилитой к сканеру, а ч/б и серые FineRiderom (слышал, что последний способ имеет существенные недостатки).

Вообще общепринятая методика сканирования книг находится тут:
http://www.djvu-soft.narod.ru/scan/scan … e_1_07.htm

Но она значительно уже устарела. Надо писать новую. :) В 2-х словах я её не смогу описать.

Могу лишь посоветовать пока что заглянуть сюда: "Как самому сделать DjVu-книгу (Краткая схема)"

http://www.djvu-soft.narod.ru/scan/123.htm

109

m7876 написал(а):

Если покупать, то только Plustek OptiBook

Не всё так однозначно. Народ жалуется - примерно через 3 года работы у этого сканера (Plustek OptiсBook 3600) "летит" лампа подсветки сканирования. А новая стоит от 50 до 150 долларов (т.е. от 15 до 50% стоимости сканера) - плюс хлопоты по пересылке почтой. И заменить её нечем - лампа-то изогнутая буквой "П".

Отредактировано monday2000 (2010-10-19 15:27:24)

110

xguar написал(а):

Как добиться, например, чтобы все страницы были одинакового размера (обложка желательно также) с минимальным значением поля, заданном в соответствующем месте, текст распологался как в оригинале и обработку при этом осуществлять за 1 сеанс?

Взять Scan Tailor. :) В ScanKromsator, конечно, тоже страницы обычно получаются одинакового размера - просто ScanKromsator - это программа "не для новичков" - а Scan Tailor - как раз наоборот. Если Вам нужно освоить именно ScanKromsator - тогда могу предложить "Пособие по Кромсатору" http://www.djvu-soft.narod.ru/kromsator/ .

xguar написал(а):

Ещё лучше, чтобы для соответствующего типа сканов, сразу задавать бы профиль соответствующий... (я конечно задал один, но что-то сомневаюсь, что им можно пользоваться без оглядки)

Да, вот как раз для сканов с полутоновыми иллюстрациями и используется методика http://www.djvu-soft.narod.ru/scan/djvu_imager.htm - где как раз задаётся каждому виду контента свой профиль DjVu-кодирования.

xguar написал(а):

Кое-что у меня получилось, но не совсем так, как хотелось бы и уж больно геморройный процесс....

Да, к сожалению, несмотря на все усилия, желаемой простоты в произодстве DjVu пока достичь не удалось. К примеру, этап облагораживания сырых сканов (перед дежавючением) по-прежнему требует использования 3-х программ (в общем случае) - это ScanKromsator, Scan Tailor и Book Restorer. Хотелось бы иметь вместо этой троицы одну универсальную программу - но пока по разным причинам не получается.

111

Zoometod написал(а):

Насущный вопрос:
Как побороть нежелание людей сканировать книги?
Основные отмазки:
Я не умею
У меня нет времени

Как мне кажется, этой цели можно добиться. Однако, это тонкая и деликатная задача. И ещё - очень, так сказать, "инерционная". Нужно сначала приложить уйму усилий (и в более-менее правильном направлении) - прежде чем народ начнёт сканировать.

Чтобы народ начал сканировать - нужно провести своего рода "рекламную кампанию" - и вложить в это изрядную толику своих усилий любого плана. Как говорится, "нужно очень захотеть" - и тогда со временем Ваше желание как бы передастся окружающим (мне так кажется). Без изрядных усилий дело не пойдёт, пожалуй.

112

Zoometod написал(а):

А натуралисты походу вымерли вместе с СССР.

Да, это существенная проблема. Но всё-таки хоть 2-3 человека-то найдётся - а 2-3 человека - это уже изрядная "книгосканировочная" сила (при условии, что они регулярно сканируют). Студенты-биологи - вот где можно поискать (а лучше всего - аспиранты-биологи, собирающиеся защищаться - и имеющие "подневольных" студентов - потенциальных сканировщиков - вот кому DjVu-литература жизненно необходима).

Отредактировано monday2000 (2010-10-19 15:57:50)

113

monday2000 написал(а):

Интересно - через какой срок из оттуда удаляют? Я вот пока не сталкивался с удалением.

думаю в архиве лежит не больше месяца, если не будет скачиваний с архива.

114

monday2000 написал(а):

Лучше бы конечно Вашему сообществу скинуться и купить себе хостинг - и туда всё выложить

хостинг есть, аж целых три, только не у меня а у хрошего знакомого m7876 который размещает все биологические книги на своих сайтах и в огромных количествах сканирует книги

115

monday2000 написал(а):

Студенты-биологи - вот где можно поискать (а лучше всего - аспиранты-биологи, собирающиеся защищаться - и имеющие "подневольных" студентов - потенциальных сканировщиков - вот кому DjVu-литература жизненно необходима).

эти только попрошайничать могут книги из обменного фонда.

Много сканов на руках у ученых, только они делиться не спешат.

Специально создал обменный фонд чтоб стимулировать сканированние, только много пользы от этого нет

116

у меня была идея  замутить взаимовыгодное сотрудничество со сканировщиками других областей знаний, (я сканирую их интересующие книги, они меня интересующие) только из этого думаю ничего не выйдет, народ не подхватит и мне одному придется расхлебываться

117

monday2000
спасибо, только все приведённые вопросы уже решены...
Лично у меня (кроме отсутствия денег на новое оборудование) никаких проблем нет уже почти год 8-)

118

Zoometod написал(а):

хостинг есть, аж целых три,

Да я имею в виду не просто хостинг - а большой хостинг - на 5-10 ГБ - где DjVu-книги выложены непосредственно там. По крайней мере, на http://www.zoomet.ru , куда ни посмотри - все книги лежат на файлообменниках - а не на самом zoomet.ru. Кстати - а какие ещё у Вас есть хостинги с книгами, кроме zoomet.ru?

Zoometod написал(а):

у меня была идея  замутить взаимовыгодное сотрудничество со сканировщиками других областей знаний, (я сканирую их интересующие книги, они меня интересующие)

Едва ли тут возможна такая прямая договоренность. Это же не товарно-денежные отношения. :) На мой взгляд, метод обмена "книга на книгу" не очень эффективен - мне кажется, свободный взаимообмен предпочтительнее. Да и сканировщикам из других областей знания Ваша область вряд ли интересна. Наверное, нужно развивать свою область.

Есть ещё один вариант, куда класть книги. Правда, немного сомнительный - но я им уже года 2 пользуюсь более-менее успешно. Это почтовый ящик nextmail.ru - там при ящике даётся файловое хранилище 2 ГБ с максимальным размером файла 50 МБ. Всё, что нужно - хотя бы раз в 4 месяца ( http://nextmail.ru/ovr/agreement.phtml?t=2 ) зайти в ящик хотя бы раз - чтобы файлы не стёрлись. Немного неудобно - но всё же реально. А можно, по идее, на своём платном хостинге написать PHP-скрипт, который будет автоматически периодически заходить в ящик nextmail. Правда, были в прошлом случаи, когда с nextmail по неизвестной причине пропадали все файлы. Они объясняли это сбоями оборудования. Но вот где-то год назад они переработали свою систему - и с тех пор тьфу-тьфу - ни единого сбоя.

Отредактировано monday2000 (2010-10-20 11:07:04)

119

Zoometod написал(а):

Интересно какой у кого сканер

А у меня МФУ HP F2483, с очень удобным, на мой взгляд, программным обеспечением. :glasses:
Правда сканированием книг полностью не занимался, только отдельные главы, с наиболее ценным для меня материалом, хранил их в в виде "сканированное изображение" с расширением .jpg в отдельных папках по названию глав, а уже эти папки вкладывал в папку с названием книги. Вот такая вот технология. Не очень-то и удобно...
Хочу освоить Вашу методику сканирования книг, тогда может быть смогу чем-то помочь :flag:

120

monday2000 написал(а):

Да я имею в виду не просто хостинг - а большой хостинг - на 5-10 ГБ - где DjVu-книги выложены непосредственно там. По крайней мере, на http://www.zoomet.ru , куда ни посмотри - все книги лежат на файлообменниках - а не на самом zoomet.ru. Кстати - а какие ещё у Вас есть хостинги с книгами, кроме zoomet.ru?

http://ashipunov.info/shipunov/school/sch-ru.htm
http://herba.msu.ru/shipunov/school/sch-ru.htm


Вы здесь » БИОЛОГИЧЕСКИЙ ФОРУМ » ЭЛЕКТРОННАЯ ЛИТЕРАТУРА » СКАНИРОВАНИЕ КНИГ