Skocz do zawartości
Forum Kopalni Wiedzy
KopalniaWiedzy.pl

reCAPTCHA - nie marnuj czasu na CAPTCHA

Rekomendowane odpowiedzi

Luis von Ahn i jego koledzy z Carnegie Mellon University chcą, by miliony internautów, którzy codziennie wpisują wyświetlane im na ekranie specjalne kody (tzw. CAPTCHA) pozwalające odróżnić człowieka od automatycznego programu, przestały marnować czas. Zamiast wpisywać przypadkowe ciągi znaków, możemy zamieniać stare teksty na postać cyfrową.

Nazwa CAPTCHA pochodzi od „completely automated public Turing tests to tell computers and humans apart”, czyli „całkowicie zautomatyzowane publiczne testy Turinga, odróżniające komputery od ludzi”. Są one coraz częściej stosowane przy logowaniu się do różnych serwisów. Ich celem jest uchronienie serwisu przed zalewem spamu ze strony automatycznych programów. Komputery nie są bowiem w stanie odczytać przedstawionych znaków, dlatego ich bezbłędne wpisanie jest gwarancją, że wpisującym jest człowiek.

Von Ahn chce wykorzystać fakt, że, jak się ocenia, każdego dnia internauci korzystają z CAPTCHA około 60 milionów razy. Każdy z nich spędza przy tym około 10 sekund, co oznacza, że każdego dnia na wypełnianie CAPTCHA ludzkość marnuje ponad 150 000 godzin – mówi Ahn.

Mężczyzna pracuje przy projekcie Internet Archive, którego zadaniem jest przełożenie na formę cyfrową dostępnej literatury. Każdego miesiąca skanowanych jest 12 000 książek. Następnie otrzymane obrazy są analizowane przez oprogramowanie OCR, które zamienia pliki graficzne w tekst. Jednak oprogramowanie nie jest doskonałe i, szczególnie w przypadku starych tekstów, których skany są złej jakości, nie jest w stanie poradzić sobie z jego odszyfrowaniem. Co miesiąc powstają więc setki tysięcy plików graficznych, które trzeba przepisywać ręcznie.

Von Ahn chce, by pliki te były automatycznie dzielone na poszczególne słowa i rozsyłane po Internecie, gdzie byłyby wykorzystywane w formie CAPTCHA. Następnie, jeśli dane słowo zostałoby identycznie odcyfrowane przez wystarczająco dużą liczbę osób, nadzorujący pracę serwer uznawałby odczyt za prawidłowy i w ten sposób składał cały tekst.

Projekt von Ahna, o nazwie reCAPTCHA, zyskał spore uznanie. Intel dostarczył von Ahnowi sprzęt, a prace badawcze są finansowane przez MacArthur Foundation. Już teraz każdy właściciel witryny WWW może przyłączyć się do projektu reCAPTCHA.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

  • Podobna zawartość

    • przez KopalniaWiedzy.pl
      Microsoft stara się o uzyskanie patentu na połączenie reklam i techniki CAPTCHA. Koncern złożył wniosek patentowy już w lutym 2008 roku. Został on upubliczniony przed dwoma tygodniami.
      Z CAPTCHA, systemu umożliwiającego odróżnienie człowieka od komputera, korzysta bardzo dużo witryn internetowych. Technika ta polega na rozpoznawaniu wyrazów bądź innych ciągów znaków i ich wpisaniu w odpowiednie pole. Dopiero po prawidłowym przejściu tego testu możliwe jest np. zarejestrowanie się w danym serwisie.
      Microsoft wpadł na pomysł, by połączyć CAPTCHA z reklamą. Użytkownicy są przyzwyczajeni do reklamy i generalnie są w stanie rozpoznać jej zawartość czy przesłanie - czytamy we wniosku patentowym Microsoftu. Koncern chce, by w roli tekstu do rozpoznania występowała reklama. Wówczas użytkownik musiałby prawidłowo odszyfrować i wpisać w odpowiednie pole nie ciąg przypadkowych znaków, a np. hasło reklamowe czy musiałby rozpoznać reklamowany produkt. W reklamie bazującej na CAPTCHA można by wykorzystać najróżniejsze materiały - zdjęcia, tekst, kolory, hasła itp. itd.
      Koncepcje wykorzystania CAPTCHA w reklamie pojawiły się jednak prawdopodobnie już 2005 roku. Podobno na niektórych blogach czy grupach dyskusyjnych użytkownicy rozważali możliwość umieszczenia w CAPTCHA sloganów reklamowych czy znaków firmowych.
      Nie wiadomo, czy fakt pojawiania się już wcześniej tego typu pomysłów wpłynie na decyzje Urzędu Patentowego. Rzecznik Microsoftu, pytany o opinię, stwierdził, że jego firma nie komentuje procesu rozpatrywania złożonych przez nią patentów. Dodał, że nie jest niczym niezwykłym istnienie wielu patentów opisujących podobne rozwiązania.
    • przez KopalniaWiedzy.pl
      Amazon, Yahoo! i Microsoft utworzą Open Book Alliance, które ma przeciwstawić się zagrożeniu jakie, ich zdaniem, stwarza tworzona przez Google'a ogólnoświatowa cyfrowa biblioteka. Wspomniane firmy będą współpracowały z Internet Archive, które od początku sprzeciwia się pomysłowi Google'a. Jego twórca, Brewster Kahle, obawia się bowiem, że jeśli Google dopnie swego, w Internecie będzie istniała tylko jedna biblioteka.
      Musimy tutaj przypomnieć, że w ubiegłym roku Google zawarł ugodę z amerykańskimi wydawcami. Na jej podstawie firma zobowiązała się do utworzenia Book Rights Registry, w której będą mogli rejestrować się wydawcy i autorzy, by otrzymać wynagrodzenie. Opłata za korzystanie z książek będzie dzielona w stosunku 70:30. Większą część otrzymają właściciele praw autorskich, mniejszą - Google.
      Duże kontrowersje wzbudza też fakt, że wyszukiwarkowy gigant zyskał prawo do publikacji tzw. dzieł osieroconych, czyli takich, w przypadku których właściciele praw nie są znani. Ocenia się, że tego typu książki stanowią 50-70% dzieł opublikowanych po 1923 roku.
      Ugoda wywołała burzę, gdyż wynika z niej, że Google nie ma obowiązku pytać nikogo o zdanie na publikowanie książek. Może zeskanować np. książkę polskiego autora, która znajduje się w zbiorach którejś z amerykańskich bibliotek. To właściciel praw do dzieła musi ewentualnie poinformować Google'a, że chce, by firma dzieliła się z nim zarobionymi pieniędzmi lub też, że nie życzy sobie, by Google publikowało jego dzieło. W ubiegłym roku porozumienie zostało skrytykowane przez polskich autorów i wydawców. Dyrektor Biblioteki Narodowej mówił wówczas, że wielkie wątpliwości budzi fakt, iż na podstawie umowy pomiędzy koncernem a organizacjami wydawców w jednym kraju zostaje naruszone, odmienne przecież od amerykańskiego, prawo w innych krajach. Google usprawiedliwia się twierdząc, że dla firmy byłoby dużym problemem samodzielne określanie sytuacji prawnej poszczególnych dzieł, dlatego też to właściciele praw powinni zgłaszać się do Google'a i wszystko wyjaśniać.
      Internet Archive obawia się, że pomysł Google'a doprowadzi do monopolizacji cyfrowej książki. Sposoby, które wypracowaliśmy od czasu oświecenia, otwarty dostęp, wsparcie dla bibliotek, najróżniejsze typy organizacji, różne sposoby dystrybucji, mogą teraz zostać zmienione, przepakowane i sprzedane - mówi Kahle. Należące do niego Internet Archive zeskanowało dotychczas ponad 1,5 miliona tekstów i udostępnia je za darmo.
      Właściciele praw do dzieł mają czas do 4 września bieżącego roku. Wówczas zakończy się proces rejestracji w Book Rights Registry. Później nie będzie można ani otrzymać pieniędzy, ani wyrazić sprzeciwu wobec publikowania swojego dzieła.
      Pomysł Google wzbudza nie tylko obawy związane z prawami autorskimi i monopolizacją rynku. Organizacje takie jak Electronic Frontier Foundation czy Consumer Watchdog chcą, by Google zapewnił, iż w żaden sposób nie będzie zbierał i przechowywał danych o tym, co użytkownicy czytają.
  • Ostatnio przeglądający   0 użytkowników

    Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...