Skocz do zawartości
Forum Kopalni Wiedzy
KopalniaWiedzy.pl

Czołowy badacz SI ma pomysł na lepsze rozpoznawanie obrazów przez maszyny

Rekomendowane odpowiedzi

Sądzę, że współczesne komputerowe systemy rozpoznawania obrazu są niewłaściwie zaprojektowane. Działają lepiej niż cokolwiek innego, ale to nie znaczy, że działają dobrze. Śmiałe stwierdzenie, ale gdy wypowiada je Geoff Hinton, jeden z twórców maszynowego głębokiego uczenia się, to warto się nad jego słowami zastanowić.

Współczesne systemy rozpoznawania obrazów korzystają z olbrzymich zbiorów danych, na podstawie których uczą się, jak wygląda dany przedmiot. Po przeanalizowaniu tysięcy, a czasem milionów zdjęć wykonanych w różnych warunkach, pod różnymi kątami, są w stanie stwierdzić, że obiekt na zdjęciu, z którym dotychczas nie miały do czynienia, to np. samochód. Oczywiście znalezienie odpowiedniej ilości danych nie jest obecnie żadnym problemem. Jednak za każdym razem gdy chcemy maszynę nauczyć rozpoznawania kolejnego obiektu, musimy zapewnić jej dostęp do odpowiedniej ilości danych, których przetworzenie wymaga z kolei olbrzymich farm obliczeniowych. Komputery działają więc znacznie gorzej niż np. ludzie, którzy po jednokrotnym obejrzeniu obiektu potrafią go później rozpoznać.

Hinton opublikował ostatnio dwa artykuły, w których postuluje stworzenie znacznie bardziej wydajnego systemu rozpoznawania obrazów. Jego największą zaletą jest fakt, że nie będzie on potrzebował tak wielkiej ilości danych jak systemy obecne.

Hinton postuluje stworzenie czegoś, co nazywa „sieciami kapsułowymi”. Każda z takich sieci składałaby się z grupy sztucznych neuronów zajmujących się tylko jednym z wielu elementów obrazu. System stworzony z połączenia takich kapsuł działałaby podobnie do tego, w jaki sposób ludzie przetwarzają i przechowują informacje wzrokowe. To zaś pozwoliłoby mu na zrozumienie, że ołówek odwrócony o 180 stopni nadal jest ołówkiem. I do wysunięcia takiego wniosku system nie potrzebowałby analizowania wcześniej tysięcy obrazów ołówka.


« powrót do artykułu

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

No wreszcie - dokładnie taki system opisywałam około 6 lat temu. Oczywiście nikt mnie nie słuchał. Teraz ktoś "wymyślił". Nie chodzi o patent czy zyski - chodzi o to że wiele wartościowych pomysłów jest pomijanych bo wymyślił je "amator", a wiele bzdurnych zyskuje dlatego że jest szansa na tym zrobić karierę - niezależnie od skuteczności. 6 lat temu mówiłam że trzeba AI podzielać na małe podzespoły wyspecjalizowane z analizie różnych elementów, oraz w system łączenia i upraszczania wniosków z tych podzespołów

Edytowane przez Ergo Sum

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Może warto wtedy było napisać trochę kodu, lub przekonać kogoś kto mógłby Ci w tym w tym pomóc. Jeśli próbowałeś to wielka szkoda że się nie udało. No tak, ktoś znany w tej dziedzinie może rzucić pomysłem i będzie pewien że ktoś go wykorzysta, ale chyba nie ma w tym nic złego  ;)

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Sęk w tym, że w oryginale tego artykułu wspomina On dzieciach, które nie potrzebują milionów obrazów żeby się czegoś nauczyć. Niby tak, ale po pierwsze dzieci spędzają jednak kilka lat na nauce podstawowych czynności i rozpoznawaniu podstawowych obrazów. Po drugie, nikt nie wie jak mózg działa i koncepcja mimo, że wydaje się trafna (podział), to nikt nie wie "gdzie podzielić".

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach
Niby tak, ale po pierwsze dzieci spędzają jednak kilka lat na nauce podstawowych czynności i rozpoznawaniu podstawowych obrazów. Po drugie, nikt nie wie jak mózg działa i koncepcja mimo, że wydaje się trafna (podział), to nikt nie wie "gdzie podzielić".

Coś w tym jest, musi być dostępna jakaś wiedza, żeby móc dokonać syntezy. Neurony widzą co trzeba koła, drzwi, małe detale, ale synteza jest trudniejsza: koła + drzwi + kształt + wielkość = samochód, ale nie barakowóz* i nie autobus.

Gdybym miał pisać własną AI chyba szedłbym właśnie w połączenie sieci neuronowych do analizy z grą w 20 pytań do syntezy. Czy to ma koła? Czy ma kierownice?  Małe wysepki nueronów łatwo odpowiadają na proste pytania.  Oczywiście w zbiorze odpowiedzi musi istnieć obiekt.

Tak więc Ergo Sum pomysł masz świetny, ale nie patentowalny :) Implementacja bije ideę implementacji.

 

*)współczesne dziecko chyba nie masz na wypowiedzenie słowa: barakowóz :)

Edytowane przez Jajcenty

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

No wreszcie - dokładnie taki system opisywałam około 6 lat temu. Oczywiście nikt mnie nie słuchał. Teraz ktoś "wymyślił". Nie chodzi o patent czy zyski - chodzi o to że wiele wartościowych pomysłów jest pomijanych bo wymyślił je "amator", a wiele bzdurnych zyskuje dlatego że jest szansa na tym zrobić karierę - niezależnie od skuteczności. 6 lat temu mówiłam że trzeba AI podzielać na małe podzespoły wyspecjalizowane z analizie różnych elementów, oraz w system łączenia i upraszczania wniosków z tych podzespołów

 

Ten gościu w wywiadzie powiedział, że miał na to pomysł od prawie 40 lat, ale nie udało mu się pewnych problemów aż do teraz rozwiązać :)

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

  • Ostatnio przeglądający   0 użytkowników

    Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...