подумалось - а когда уже отсканят всё и сделают бесплатным все книжки на свете (купленные кем-то когда-то) ? ведь если тираж (изданный, например, 30 и более лет назад) книжки распродан, значит, издательство и авторы удовлетворены. И значит, любая книга и любая инфа из тех книг может уже быть использована кем угодно ведь? или есть ещё бляди, паразитирующие на "лицензионных/авторских отчислениях" ? сколько тысячных процента займут те djvu-шки на гугловских серверах? сколько долей процента потеряет гугл на рекламе, если проиндексирует и будет выдавать хотя бы на 3й странице в результатах сслыки на те дежавюшки?
Официально - есть сроки давности после которых права переходят обществу. А практически пиратские сайты никто не отменял.
эти геи, в плохом смысле - им уже за честь совершить "каминг-аут" и сказать "смотрите - я пидарас!" но почему ни одному гею в гугле не приходит мысль совершить обратный каминг-аут - "смотрите! я - хороший человек! я отсканировал и предоставил в свободный (и удобный) доступ все знания человечества!" ? ... риторически, в воздух.
таки больше 0.1% от прибыли гугла??? на самом деле давно уже работает оцифровка. я по какому-то проекту в России (библиотека им.Ленина в Москве) помню. а ещё редкие книжки где-то в европе сканировали - но там раритеты какие-то, в перчаточках книжку аккуратно переворачивали и на сканер клали. думается, сейчас можно просто очень хорошим фотиком снимать и получать 600dpi цветные фоточки, аккуратно обработанные "фотошопом" на предмет геометрических искажений при фотографировании. но придумали аппарат, который умеет очень аккуратно листать книжки и укладывать их на стекло сканера. стоит это... тысячи долларов, конечно. но по-сравнению с доходами корпорации - это именно что даже не копейки, а доли копеек.
Пусть будет 0.1%. Это порядка 35 мильенов баксов в год. Ты оплатишь? Нет, а кто? А не лучше ли "пенсионерам раздать" или детдомам? Ты на несколько порядков ошибся. Это огромная кропотливая ручная работа. Сотни человеко-лет.
Хмммм... А задачка то в общем-то не особо технически и страшная. Скорость съёмки, положим, ну не 25 к/с, а, положим, 5 к/с. С какой скоростью можно листать книгу, чтобы разворот снять. При этом даже не обязательно до 180° разворачивать книгу. 90° будет уже сильно норм. Две камеры... Дальше процесс анализа, распознавания и оптимизации объёма.
Это трудоемко. Особенно если делать приличную вёрстку электронной версии книги с ручным контролем результата а не просто тупой скан, "как есть". Но даже если делать тупой скан это проблема ибо выйдет огромный объем растра и сомнительного качества результат, ибо по нему даже качественного поиска не будет. Еще надо учесть получение (покупку, оформление аренды, и т.п.) книг. Их сортировку, логистику и хранение. Ну и еще каталогизацию и публикацию результата. При таких объемах это задача не тривиальная.
По первому пункту многое возможно заскриптовать. Ручная верстка вряд ли понадобится. Тем более, что некоторые вещи оставить лучше в оригинальной, родной версткой. По второй части - все это есть уже в библиотеках.
Если устраивает оцифровка в режиме "тяп-ляп" тогда, наверно, да. Придется повторить еще раз. А даже если подойдет то что уже сделано - на это уже были потрачены соответствующие ресурсы. И продолжают тратиться.
Блин. Система распознавания лиц работает риалтайм в Московском метро. Есть сервис антиплагиата. Простую бд не судьба?
Если делать не lib.ru, а "простую бд" с полнотекстовым поиском (а иначе нафиг оно надо) - тут капец какие ресурсы нужны.
Чисса каталог. Библиотечный К библиотечному каталогу уже ресурс книжек. Речь шла за то, чтобы не пересекались Хотя шо я спорю!? Вы за рулем - вы и тормозите!
Знаешь сколько это стоило в человеко-часах и деньгах? Не купить готовое, а именно разработать и отладить. Да и не надо сравнивать яблоки с кирпичами. Это разные задачи и задача оцифровки полюбому трудоемка. Если, конечно, вопрос качества результата и достоверности оцифровки вообще стоит.