Да-да, их работы в Google Books наверняка принесли хорошие плоды, которые мы можем начинать пожинать. И сейчас я вам расскажу как.
Сканированные документы не всегда требуют превращения в реальный текст. Однако иногда так хочется не набирать какое-нибудь соглашение снова, а электронной копии-то и нет. Конечно, вы могли бы воспользоваться какой-нибудь дешевой программой OCR, идущей вместе со сканером, или даже купить (не воровали же вы) FineReader. Но время бесплатных настольных OCR программ проходит еще и потому, что сейчас тексты все чаще фотографируют, а не сканируют.
Для загрузки любых картинок (jpeg, png, gif) с текстом для последующего распознавания Google и открыл API в Google Docs. Теперь вы можете загружать картинки в библиотеку документов, а сервера Google превратят ее в текст.
Существует и приложение пример, иллюстрирующее работу API:
Но вам, программисты, следует подумать о создании своих интерфейсов к этим возможностям. Например - у вас есть сканы книг в PNG? Это извращение, не правда ли? Так вот вам и карты в руки - напишите приложение которое загружает текст постранично, не нарушает лимитов и соединяет всю загрузку в единый текст.
Но помните, ограничения у API есть, и главное из них, мне кажется, - то что распознается только латиница, пока только она. Кроме того нужно следить чтобы высота символов была не меньше 10 пикселей, а общий размер картинки не превышал 10 мегапикселей.
Станьте первым, кто оставит комментарий