Home > интернет | Новости > Поисковик Google научился различать слова на изображениях

Поисковик Google научился различать слова на изображениях

Posted on 30 Октябрь 2008 | No Comments

Компания Google разработала систему оптического распознавания текста. Она позволяет поисковику различать текст на отсканированных изображениях. Об этом сообщается в официальном блоге Google.
В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается.

Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки.

Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний.

Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи.

Оригинал статьи на lenta.ru

» Tags: , , ,

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>