OAS> Делаем сканирование страницы в максимальном качестве. Если документ старый, то и историкам будет интересно посмотреть на особенности завитушек. + Возможно сканируется геометрия документа.
OAS> На выходе имеем документ для разных групп пользователей.
ну, это для отдельных людей кто-то отдельно может делать..
Обычно доки сканят чтоб их читать )
То есть, мануалы, самоучители, энциклопедии, учебники, инструкции, т.д.
OAS> Индивидуализм/частный/государственный заказ?
всё в частном порядке, ессно..
Просто ранее работали для соотношения на закрытых торрент трекерах, потом - раскладывали на обменниках с рекламой и им капало за показ рекламы, сейчас для чего - хз, не интересуюсь.
Но это (кто всерьез занимается) терабайтные обьемы закачек, не до развлечений, всё на автомате..
OAS> Автоматизированный перевод в текст никогда удовлетворительно не работает без вычитки и бывает с привлечением специалистов. Иллюстрации будут посредственного качества. Какая в Прибалтике скорость Инета для пользователей стационарных/мобильных?
так опять же, смотря для чего.
для задач инструкций - более чем достаточно.
Для каталогов произведений искусств в хайрезе - само собой, другое дело ))
Скорость - разная.
У меня условно бесплатный мегабит (мне просто не надо больше).
Мобильные.. ну, на планшетке смотреть фильмы по ютубу проблем нет, а что-то большое не качал.
OAS> Книги отсканированные индексируются кроме названия? Формат скачивания виден, тогда о каком мусоре идёт речь?
цифромусор - имеется в виду, что текст (печатная страница - 5 килобайт в текстовом виде) выкладывается в хайрезе веся несколько МЕГАбайт, зажимаясь в пдф. Как итог - книга весит в тыщу раз больше. И ради чего? Чтоб рассматривать дефекты шрифта, отпечатки жирных пальцев на бумаге, или артефакты сканирования? А кому оно надо? Потому именно цифромусор.
Когда речь об одной книге - можно попривиредничать, а как у меня была кучамала на несколько двд - необходимость перемалывать гиги ради какой-то новой инструкции или книжки начинает бесить.