Блог

 
 

§65 reCAPTCHA: «Цена вопроса»?

В последнее время в Интернете всё большей популярности набирает, так называемая, reCAPTCHA. Причём ставят её все – от мала до велика, начиная с персональных сайтов, - заканчивая посещаемыми форумами.

reCAPTCHA: «Цена вопроса»?

Многие разработчики и вебмастеры свято и непоколебимо уверены, что данная капча помогает защитить от автоматических спам-ботов. Это в корне не верно. Данная «религия» имеет место только в том случае, когда у спамера нет денег – об этом чуть позже.

reCAPTCHA: «Цена вопроса»?

В довольно узких кругах все знают, что распознать эту капчу в автоматическом режиме не составит абсолютно никакой сложности. Существуют специальные сервисы, которые за скромную плату помогут в распознавании таких капч. Эти сервисы располагают довольно мощным API, позволяющий интегрировать сервис с практически любым программным комплексом: от десктопного – до веб-скриптов. Процент распознавания – практически равен такому при распознавании человеком. Стоимость? 1$ за 1000 отправленных капч. Признайтесь – это сущие копейки (особенно для людей, зарабатывающих на этом).

reCAPTCHA: «Цена вопроса»?
reCAPTCHA: «Цена вопроса»?

Что мы имеем в итоге?

Ресурсы поголовно как из инкубатора, начинают использовать «готовое решение», таблетку от спама.

Рядом с этим страдает только обычный пользователь. Школоту, скачавшую софт на шару – мы в расчёт не берём. Спамеры – профи, они будут использовать API антикапчи.

Как устроена reCAPTCHA

Более подробно эта тема описана в одной из заметок на хабрахабре.

Если вкратце, то Wikipedia нам скажет следующее:

reCAPTCHA — система, разработанная в университете Карнеги — Меллон для защиты веб-сайтов от интернет-ботов, и одновременной помощи в оцифровке текстов книг. В сентябре 2009 года reCAPTCHA была приобретена компанией Google. На начало 2011 года, reCAPTCHA осуществляла оцифровку архивов газеты «The New York Times» и книг, доступных в Google Book Search.

Что это значит? Пользователю предъявляется одно случайно сгенерированное слово, изображение которого искажено (оно заведомо известно системе), и одно слово из оцифрованного документа, которое не смогла распознать система оптического распознавания (OCR). Оба слова пользователь должен ввести в поле ввода в виде текста.  Т.е. в отличие от традиционных систем распознавания, система reCAPTCHA предлагает пользователю ввести два слова.

Одно из них известно системе, другое слово системе. Проверка ввода осуществляется по тому слову, которое известно системе. Неизвестное системе слово, введённое пользователем, сохраняется и используется в качестве возможного варианта распознания.

Эффективность reCAPTCHA была (до появления anticaptcha) только в том, что она помогала распознать текст, неразличимый OCR, основываясь на множестве предоставленных распознанных вариантов.
Таким образом, пользователи вынуждены вводить вдвое больше текста, чем в других системах. Рядом с этим, весь доход от распознавания текста остаётся корпорации Google, что расценивается некоторыми как принудительная эксплуатация труда.

Критика

В последнее время, reCAPTCHA подвергается критике пользователей из-за того, что картинки с трудом распознаются даже человеком, при этом защита – чисто теоретическая. На практике, пользователь не обязан вводить оба слова – одно из них не проверяется (можно ввести любую букву или слово вместо него). Не проверяемое слово можно определить по наличию запятых, восклицательных, вопросительных знаков и т.д., оно не раздваивается, как проверяемое слово. Также возможна инверсия цветов фона и букв у не проверяемого слова. Таким образом, данная методика получила широкое распространение, на выходе получатся неточности.

reCAPTCHA: «Цена вопроса»?

Почему я с уверенностью говорю о искажении данных? Здесь вполне применим закон Парето. Если его интерпретировать к этому случаю, получится, что 80% пользователей создают только 20% трафика загружаемых изображений, остальные 80% трафика могут создать спамеры. И у них для этого инструментов более, чем достаточно: гибкий API, низкая стоимость распознавания, наличие специализированного софта, прокси-сервера, возможность подмены useragent и т.д.

Послесловие

Каждый веб-мастер в праве сам принимать решение, какую систему защиты от спама ему использовать. Однако, я бы крайне не рекомендовал использовать reCAPTCHA. Сама идея – хороша, но реализация не учитывает современных реалий. В итоге – пострадает только обычный пользователь.

На текущий момент, нет системы лучше, нежели модерация людьми. Для некоторых ресурсов потребуется не один модератор. Пример эффективной реализации – ресурс Хабрахабр, который, по сути, является саморегулируемым: пользователи выставляют рейтинг публикациям и комментариям, а также выставляют «карму» пользователя. При достижении негативных значений у комментариев – они скрываются, при негативном рейтинге – пользователь ограничен в правах. В зависимости от уровня рейнтинга и кармы, пользователю доступно некоторое число голосов.

Рейтинг влияет на возможности:

reCAPTCHA: «Цена вопроса»?

У каждого - свой рентинг.

reCAPTCHA: «Цена вопроса»?

Негативные комментарии скрываются, это влияет на рейтинг.

reCAPTCHA: «Цена вопроса»?

Итоговая оценка зависит от разницы позитивных и негативных голосов.

reCAPTCHA: «Цена вопроса»?


Рекомендуем также
  • Превращаем СДЛ в УГ: 10 шагов » Нужно создать такое меню, в котором сам создатель будет использовать «указательные знаки». Разделы подменю должны быть как можно больше несбалансированны. Главная изюминка – ...

  • Ликбез: кнопки и счётчики 88х31 » В последнее время среди многих веб-мастеров стало «стандартом» вешать гору говно-кнопок на свои сайты. Зачем это нужно – они сами того не знают, но упорно доставляют одну за ...

  • Групповые команды Skype » Skype является довольно мощным инструментом для создания групповых конференций. Рассмотрим известные команды для управления конференциями. ...

  • Бесплатный софт, достойный внимания » Практически каждый человек, повседневно работающий за ПК, использует с десяток программ. Одни из них платные, другие – бесплатны. От удобства софта во многом зависит производительность труда и ...

  • Google Music: всегда рядом » В среду, 16-го ноября на презентации в Лос-Анджелесе, Google анонсировал выход сервиса Google Music из стадии Beta, а так же открытие магазина музыки. Корпорация подписала соглашения более чем с 1000 ...

  • Мобильные устройства и социальные сети » Оговорюсь сразу. Я не сторонник соц сетей, но многое указывает именно на это направление развития, хочется нам того или нет.Не так давно на несколько людей приходился один телефон, не так давно на ...

  • 140 правил интернет-журналиста » Сегодня в блоге Александра Амзина приметил замечательную подборку правил для интернет-журналистов. Спешу поделиться! Будет очень полезно для прочтения всем, кому приходится излагать мысли и ...


  • Заметка опубликована 23.11.11. Со времени публикации её просмотрели 4119 раз. Если вам понравилась заметка «reCAPTCHA: «Цена вопроса»?», вы можете поделиться ею со своими друзьями. Всё, что требуется сделать - нажать на одну (или несколько) из кнопок чуть ниже.



     

    К данной публикации комментариев ещё нет, но вы можете оставить свой комментарий первым, для этого воспользуйтесь формой ниже. После проверки ваше сообщение появится на сайте. Убедительная просьба соблюдать правила комментирования.

    Представьтесь:*
    E-Mail (не публикуется):
     
     
     
     
     
     
    Я ознакомлен(а) и принимаю правила комментирования.
    Включите эту картинку для отображения кода безопасностиНе читабельно? Обновите код!



    Последние заметки в блоге

     
    11.11
    2016
    Скидки в Rozetka.com.ua: ноябрь 2016, промокод ко Дню Шопинга 11.11: Итак, друзья, продолжаем традицию с промокодами. Для тех, кто не... [ Читать ]
    03.11
    2016
    Mikrotik обновил часть своих устройств: новые процессоры и радиомодули для cAP, mAP, OmniTIK 5, OmniTIK 5 PoE, QRT 2, SXT 2, DynaDish 5, SXT HG5 ac, SXT 5 ac, SXT SA5 ac и SXT Lite5 ac: Компания Mikrotik анонсировала большое обновление для своих устройств. Чуть ранее... [ Читать ]
    03.11
    2016
    Обзор маршрутизатора Mikrotik hEX rev.3 (RB750Gr3): аппаратный IPSec, мощный двуядерный процессор, 256 Мб оперативки и поддержка Dude Server: Компания Mikrotik анонсировала обновление маршрутизатора hEX до 3-ей ревизии– RB750Gr3.... [ Читать ]
    03.11
    2016
    Обзор Ubiquiti Rocket 5ac Prism: оптимальное решение для базовых станций и линков PTP по соотношению цена/качество: Год назад, на конференции Ubiquiti NEXT 2015, проходящей в Лас-Вегасе,... [ Читать ]
    01.11
    2016
    Сравнительный обзор EdgePoint EP-R6, EP-R8 и EP-S16: упрощаем коммутацию внутри сети: 12 октября в Лас-Вегасе на ежегодной конференции NEXT 2015 Роберт... [ Читать ]

    Самое популярное

     

    На правах рекламы ↓

     

    Навигация по тегам

     
    802.11ac, 802.11n, Android, DVB-T2, EdgeRouter, Google, hAP, hAP lite, Mikrotik, Parom.TV, RB951Ui-2HnD, RouterBOARD, RouterOS, Rozetka, rozetka.com.ua, Strong, Strong 8500, Strong SRT 8500, Trimax, Ubiquiti, UBNT, UniFi, Wi-Fi, Winbox, антенна, маршрутизатор, настройка, обзор, обновление, онлайн ТВ, планшет, промо, промо-код, прошивка, ресивер, роутер, сайт, скидки, тест, точка доступа

    Показать все теги