GD Star Rating
loading...

Доброго времени суток, однобложникые!

Молодой я еще и не опытный, но очень любопытный. К тому же, возможно, я еще не научился пользоваться поиском Витеньки, да и на хабре у меня нет реги. Так что я решил задать этот вопрос тебе, дорогая блог.
Как-то 10 минут назад регистрировал себе аккаунт, не суть важно где. Там была на столько устойчивая CAPTCHA, что даже мой не очень искусственный интеллект с трудом ее обрабатывал и доказывал, что я не робот. Полазив по разным формам регистрации я насмотрелся всяческих изощренных способов защититься от автоматической регистрации, но подавляющее большинство – это КАПТЧА. Она на самом деле такая устойчивая? Неужели до сих пор нет всяческих алгоритмов, которые могут вскрыть хотя бы 50-60% предложенных ему испытаний?

Image #1376348, 3.5 KB

Админы и сочувствующие посетители hardblog.net посчитали злободневным:Говорилиум.Ру

Tagged with →  

23 Responses to Доброго времени суток, однобложникые!

  1. Ovenode:

    ну конкретно то что на картинке это рекапча, и она как раз основана на словах которые не могут автоматически распознать при оцифровке книг.

  2. Nedodin:

    : То есть ты хочешь сказать, что у создателя рекапчи есть толпа негров, которые руками переводят картинки в строку, а потому складывают их в базу рекапчи? Или я что-то не так понимаю?

  3. KoZlo:

    : нет, просто время от времени одно из слов, которые показываются, новое для рекаптчи и они просто верят тебя

  4. Ovenode:

    : ну используй же гугл. Вобщем-то он сделал рекапчу, и у него есть проект по оцифровке библиотек.

  5. 0duaTa:

    : http://www.google.com/recaptcha/learnmor…

    But if a computer can’t read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here’s how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.

  6. KoZlo:

    : он ее купил же

  7. Nedodin:

    Это конечно полезно, но создается впечатление, что надо распознать то, второе слово, а первое хоть как-то. НО судя по всему это более чем устойчиво.

  8. Loser:

    в рекапче одно слово генерируется автоматически, и затем искажается, они вроде это признавали как-то. и они кстати его делают в последнее время настолько нечитаемым, что приходится несколько раз рефрешить, пока попадётся более-менее разборчивое.

  9. XiNSwet:

    : Так и есть. Распознать надо только одно слово. Вместо второго можно писать все что вздумается. Но ведь ты заранее не знаешь какое из этих слов не нужное, а второе все равно нужно написать правильно.

    Почему их два выше уже написали, но в основном по-англицки, поэтому еще раз расскажу по-русски. Слова эти в отличие от других капчей не генерируются с искажениями, а берутся из книг. Это те фрагмменты текста, которые не распознались при автоматическом распознавании. И вот тут рекапча убивает двух зайцев в раз. Во-первых, эти слова уже показали свою стойкость против OCR-алгоритмов, потому что не были распознаны. Рекапча показывает человеку два таких слова. Значение одного из них уже известно, значение второго еще нет. Человек вводит оба слова, если первое совпадает, то это свидетельствует о том, что по ту сторону браузера не робот, а значит он мог правильно указать и значение второго слова. Показав второе слово нескольим пользователям и получив одинаковые ответы, система убеждается в его значении. После этого оно попадает в книгу как распознанное, а также может использоваться в рекапче в качестве слова с известным значением. Как-то так. Не берусь отвечать за точность алгоритма, я его не видел, но что-то в этом роде.

    Надежно ли это? Надежность, как я говорил, обеспечивается тем, что робот уже пытался распознавать эту картинку и не осилил. С другой стороны есть и минусы. Все это происходит в автоматическом режиме, поэтому пользователь порой получает полную белиберду: либо текст так искажен, что его и человек не может прочитать, либо текст содержит такие знаки, что их на среднестатистической клавиатуре и не сыщешь, либо это вообще не текст. Нередко приходится нажимать на кнопку обновления картинки несколько раз пока получишь что-то понятное. Ну и для России немаловажно, что там английские тексты, если ты знаешь язык, то понять слово бывает не трудно, даже если часть букв неразборчива, а если не знаешь, то обновлять картинку придется еще чаще. Это существенная проблема, можно потерять клиентов. Я, например, отказался от рекапчи именно поэтому.

  10. XiNSwet:

    : Вообще, если говорить о надежности капчи то надо рассматривать не только вероятность ошибок первого, но и второго рода, как и всегда это бывает в статистике. Капча, как вариант теста тьюринга, это некий статистический критерий направленный на то, чтобы отличать людей от машин. Он не дает стопроцентных результатов, и может допускать два типа ошибок с некоторой вероятностью: принимать роботов за людей, принимать людей за роботов. Можно влиять на критерий перераспределяя вероятность между двумя этими ошибками, в зависимости от того, что в данной ситуации важнее. Вот ReCaptcha надежна в плане ошибок первого рода – не принимает роботов за людей – зато по ошибкам второго рода ненадежна – часто принимает людей за роботов. Вопрос надежна ли ReCaptcha зависит от того, что вам важнее.

  11. EnoLt:

    антикапча спасет)

  12. Arbam:

    Вероятно это связано с тем что “читать” умеют почти все.

    Можно, например, давать интегралы (была ж картинка) – но ведь почти никто не возьмет, и уж тем более нужен целочисленный результат, который в принципе проще угадать, а вот генерировать его несколько сложнее, к тому же его можно довольно просто выцепить – то есть у этого алгоритма выше цена разработки, но ниже стойкость, и выше сложность разгадывания человеком.
    Другим примером могут стать капчи типа f(g(t(p(x))), где x – некая строка, а f, g, t – описание функций, что в конечном счете заставит человека сидеть с листочком бумаги и разгадывать ребусы (процедура регистрации порой настолько анноинг), а вот машину научить распознавать насколько я понимаю не очень сложно, во всяком случае выкусить смысл и операнды, коих ограниченный набор, опять же скатываемся к системе – просто закодить, сложно человеку, машину можно обучить.
    МТС сейчас применяет некую помесь лингвистики + картинок, но я порой сам не угадываю – мне кажется у них баги в алгоритме создания загадок.
    Следующим шагом могут быть гифки, но их сложно генерировать, и вообще не понятно что делать – показывать танцы? но боюсь не всезнают о танго, фокстроде что еще там?

    А вот теперь читать… вернее переводить буквы с картинки в нажатия клавиш – этож даже обезьяне доступно!

  13. LanTunes:

    Есть много безработных китайцев, распознающих 10 таких картинок за 1 цент.

  14. XiNSwet:

    : Странно, что каптча принимает безработных китайцев за людей! Формально к каптче тут не придраться, она свою работу выполнила правильно – отличила роботов от людей. Это уже переходит в область вопросов о том является ли капча в целом эффективным средством в борьбе со спамом. Если спамят люди, то не является.

  15. LanTunes:

    : я лишь о том, что подобный сервис давно автоматизирован. Конечно, это не алгоритмический способ решения, тем не менее вполне рабочий 🙂

  16. Drasuper:

    Хрумер уже год точно рекапчу щелкает. 7 из 10, в среднем, угадывает

  17. YobRU:

    Чуваки, я такие капчи сам раза с 10-ого ввожу. Это пиздец какой-то.

  18. Nedodin:

    : А ПРЕДСТАВЬ КАКОВО РОБОТАМ!11

  19. Skoodin:

    : очень даже алгоритмический. используется генетический алгоритм и генетический же материал)

  20. RARwin:

    : иногда там иврит, кусок картинки или мусор
    И зачем рефрешить? Это-то слово явно то, которое не проверяют.

  21. Tn2All:

    Хороший вариант, кстати, заставлять человека разгадывать капчу только один раз т.е. доказал что он человек и в бд записалось что это человеческий IP, но чтобы прикрыть от спама уже считать его клики, отправки сообщений и прочее и если он становится похож на робота, то записывать этот IP 100% роботом и постоянно требовать ввести капчу.

Добавить комментарий