Ломаем каптчу Яндекса

Статус
В этой теме нельзя размещать новые ответы.

kactetus

митя is here )
Регистрация
26 Авг 2007
Сообщения
440
Реакции
281
Итак, у нас есть вот такая каптча:

Основные особенности:
6 цифр;
Изображение монохромное;
Фон белый;
Искажения, которые, однако, незначительно смещают цифры со своих позиций;
Две шумовые линии очень похожие на синусоиды.

Эту каптчу Яндекс использует давно (больше года, насколько я помню), что означает никто за это время её не сломал, они бы заметили, наверное. Поскольку даже человек иногда не в состоянии распознать все цифры, ставить задачу стопроцентного распознавания было бы глупо, да и цель у меня — просто решить интересную задачу, а не написать спам-бота. Поэтому поставим задачу распознавания каптчи с некоторой вероятность, даже одного процента будет достаточно.

Задача: написать программу, распознающую каптчу Яндекса с вероятностью не менее одного процента.

 
  • Нравится
Реакции: pori
Со скриптами для обучения кто-нибудь успел скачать? Там полчаса всего они были доступны, я не успел. А было бы интересно...
 
Можно не взламывая, воспользоваться сервисом, где индийцы разгадывают капчи за нас... Там процент вообще больше 95% :)... А так, концепция действительно интересная... На очереди Гугл...
 
Я вижу ты спец по нейронным сетям, так покажи свой пример?
 
Очень полезный скрипт былбы еслибы имелись скрипты для обучения...
Кто в курсе на хабре их выкладывали и удалили ?? или вообще невыкладывали ??
просто так скрипт абсолютно бесполезен ... процент успешного распознования всех шести цифр получится мизерным
 

Я к тому, что всегда большой процент ошибок, а это ведет к санкциям ПС
 
А если сделать полуавтомат, показывается куча капчей и решений, которые сделаны ботом. Человек отмечает те, что правильные. Это снижает с одной стороны снижает процент ошибок, а с другой - всё равно в несколько раз быстрее, чем вводить вручную.
 
А если сделать полуавтомат, показывается куча капчей и решений, которые сделаны ботом. Человек отмечает те, что правильные. Это снижает с одной стороны снижает процент ошибок, а с другой - всё равно в несколько раз быстрее, чем вводить вручную.
Это медленнее, а не быстрее
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху