Jump to content
Forum Kopalni Wiedzy
KopalniaWiedzy.pl

Teoria lingwistyczna udoskonalona po 75 latach

Recommended Posts

Steven Piantadosi, Harry Tily i Edward Gisbon z Wydziału Mózgu i Nauk Poznawczych MIT-u badają, w jaki sposób ludzie myślą i komunikują się ze sobą. Postanowili przetestować liczące sobie 75 lat językowe prawo Zipfa i zauważyli, że wymaga ona udoskonalenia. W roku 1935 lingwista George Kingsley Zipf stwierdził, że „wielkość słów ma tendencję, jako całość, do bycia odwrotnością, niekoniecznie proporcjonalną, częstości ich pojawiania się". Innymi słowy, częściej pojawiające się słowa są zwykle krótsze od tych rzadziej pojawiających się.

Jedną z najszerzej znanych i prawdopodobnie uniwersalnych właściwości ludzkiego jest ta, że często używane słowa są zwykle krótkie - napisali badacze z MIT-u. Jak wyjaśniał Zipf, ma to związek z ekonomią wypowiedzi. Angielski wyraz „of" jest tak krótki, gdyż używa się go wyjątkowo często. To czwarte pod względem popularności słowo. Najpopularniejszym słowem pisanym jest „the". Na liście 100 najczęściej używanych angielskich słów znajdziemy „be", „on", „have", „who" czy „some". To już było wiadomo za czasów Zipfa. Teraz naukowcy udoskonalili jego prawo stwierdzając, że wśród 10 badanych języków to, co człowiek mówi jest ważniejszym czynnikiem wpływającym na długość słowa od tego, jak często dane słowo wypowiada.

W czasie swoich badań uczeni chcieli porównać teorię Zipfa z własnym pomysłem, zgodnie z którym na długość słowa wpływa średnia ilość informacji, którą wnosi ona do wypowiedzi. Aby to sprawdzić użyli internetu i sprawdzili wszelkie możliwe kombinacje dwóch, trzech i czterech wyrazów występujących obok siebie. Dzięki temu mogli dowiedzieć się, na ile przewidywalne jest pojawienie się danego wyrazu.

Na przykład w kontekście „Monday night...." wystąpienie słowa „football" jest bardzo prawdopodobne, a co za tym idzie, niesie ono ze sobą niewiele informacji. Ale na przykład w kontekście „I ate...", słowo, którego brakuje, jest całkowicie nieprzewidywalne, dlatego też niesie ze sobą dużo informacji - mówi Piantadosi. Naukowcy przypuszczali, że średnia ilość informacji zawarta w sekwencji dwu-, trzy- lub czterowyrazowej powinna częściowo wpływać na długość wyrazów, albo pod względem liczby liter albo sylab. Sekwencja wyrazów jest zakodowana w języku tak, by komunikacja była jak najbardziej efektywna. A to oznacza, że sekwencja ta, to efektywny kod związany ze znaczeniem, który można wykazać w badaniach statystycznych. Takie właśnie przypuszczenie wysunęliśmy - dodaje Piantadosi.

Jeśli przyjrzymy się słowu miłość, to w różnych językach oznacza ono to samo i ma podobną długość (love, amour, liebe, amor, karlek). Jednak, jak uważają uczeni z MIT-u, na to, jak często konkretne słowo jest używane, decyduje nie jego długość, a słowa występujące po i przed nim.

Uczeni zbadali swoją teorię na przykładzie czeskiego, holenderskiego, francuskiego, angielskiego, niemieckiego, hiszpańskiego, włoskiego, portugalskiego, rumuńskiego i szwedzkiego. Okazało się, że odstępstwa od ich teorii można zauważyć tylko w niemieckim. Byłem zdumiony, że efekt ten występuje w tak wielu językach. Sądziłem, że różnice w morfologii czy strukturze wyrazów, zaburzy ten efekt w różnych językach, ale tak się nie stało - dodaje Piantadosi.

Badania z MIT-u mogą też dostarczać dodatkowych wyjaśnień, dlaczego najczęściej używane słowa są krótkie. Są bowiem przewidywalne, niosą zatem niewiele informacji. Ponadto liczne z nich to wyrazy funkcjonalne - takie jak „with", „from" czy „over" - których zadaniem jest łączenie innych słów. Krótkie wyrazy zwykle łączą się w często występujące związki frazeologiczne, a zatem takie, które wnoszą niewiele danych.

Naukowcy z MIT-u odkryli też, że ludzie komunikują się w niemal optymalny sposób. Zasób słownictwa nie jest dowolny, w tym sensie, że nie używamy go w całkowicie swobodny sposób. Jest on dobrze ustrkturyzowany pod kątem komunikacji, niosąc ze sobą pewne ciągi wyrazów, których ludzie zwykle używają - dodaje Piantadosi.

Share this post


Link to post
Share on other sites

Na przykład w kontekście „Monday night...." wystąpienie słowa „football" jest bardzo prawdopodobne

 

Dla nas europejczyków jest to pojęcie zupełnie abstrakcyjne skojarzenie, począwszy nawet od rozumienia słowa "football" jako piłka nożna, a nie jakieś amerykańskie rugby, i u nas soboty czy nawet środy lub czwartki są w  większości mecze piłkarskie, więc było dla tłumacza pole do popisu, jak z amerykańskiego na nasze przełożyć. Niestety

Amerykański - Nasz, wynik: 1 : 0

Share this post


Link to post
Share on other sites

Dla nas europejczyków jest to pojęcie zupełnie abstrakcyjne skojarzenie, począwszy nawet od rozumienia słowa "football" jako piłka nożna, a nie jakieś amerykańskie rugby, i u nas soboty czy nawet środy lub czwartki są w  większości mecze piłkarskie, więc było dla tłumacza pole do popisu, jak z amerykańskiego na nasze przełożyć. Niestety

Amerykański - Nasz, wynik: 1 : 0

 

Celowo nie spolszczałem przykładów, bo badania nie dotyczyły naszego języka, więc spolszczenie może być całkowicie  nietrafione :). Np. w j. polskim prototypem (czyli rodzajem wzorca) ptaka jest wróbel. W USA wzorcem jest drozd. Pytanie zatem, jak należałoby przetłumaczyć tytuł znanej książki: "Zabić drozda" (tak, jak przetłumaczono) czy "Zabić wróbla"? :P

Share this post


Link to post
Share on other sites

Tak, nikt nie twierdzi, że tłumaczenie jest łatwe, ale w takim momencie trzeba w nawiasie podać chyba wytłumaczenie idiomów, jeśli nie da się przełożyć na polski w sposób oczywisty.

Bardzo mi się podoba "Ojcze Nasz" w języku innuitów. Z oczywistych względów jest sformułowanie "ryby naszej powszedniej" bo po co tłumaczyć eskimosom co to jest chleb, jak i tak zrozumieli by pewnie opacznie.

ps. teraz przetłumaczyli by młodzieżowo: "zabić leszcza"  :)

Share this post


Link to post
Share on other sites

No dobra tylko be i have też mi się raczej kojarzą z konstrukcją językową coś jak nasz czas przyszły np będę szedł. I tak dalej.

A teraz zmierzać będę do konkluzji. Jak dla mnie te badania są o kant d*py rozbić bo nie koniecznie musi chodzić o częstotliwość występowania. I jakoś zupełnie mnie nie dziwi ze rodzajników we francuskim un une des le la l' les czy niemieckim der die das ein eine ein sa krótkie. Jak dla mnie powstały jako krótkie i są używanie bo wymusza tego konstrukcja językowa a jakąś magiczna korelacja długości i częstotliwości użycia. A ze względu na ekonomie mowy to są nieoptymalne.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


  • Similar Content

    • By KopalniaWiedzy.pl
      Pisanie SMS-ów wywiera negatywny wpływ na zdolność interpretowania i akceptowania nowych słów.
      Joan Lee z Uniwersytetu w Calgary ustaliła, że osoby, które wysyłały więcej wiadomości tekstowych, w mniejszym stopniu akceptowały nowe wyrazy. Dla odmiany zwolennicy tradycyjnych mediów - książek czy gazet - byli w tym względzie bardziej tolerancyjni.
      W ramach studium pytano studentów o ich nawyki dot. czytania, włączając w to SMS-owanie. Badanym przedstawiono szereg słów, zarówno prawdziwych, jak i fikcyjnych.
      Założenie dotyczące SMS-owania było takie, że zachęca ono do używania swobodnego języka. Studium wykazało jednak, że to mit. Ludzie, którzy akceptowali więcej słów, postępowali tak, bo potrafili lepiej zinterpretować ich znaczenie lub tolerować mimo braku rozpoznania. Studenci intensywniej korzystający z wiadomości tekstowych odrzucali więcej wyrazów, zamiast uznać je za słowa możliwe.
      Lee uważa, że czytanie tradycyjnych mediów wystawia ludzi na oddziaływanie zróżnicowanego i twórczego języka, sprzyjając elastyczności językowej i tolerancji w stosunku do różnych sformułowań/słów. Widząc nieznany czy nietypowy wyraz, starają się go zinterpretować.
      SMS-owanie jest związane ze sztywnymi ograniczeniami językowymi, które powodowały, że studenci odrzucali wiele słów testowych. To zaskakujące, ponieważ w języku wiadomości tekstowych istnieje wiele [reprezentujących slang internetowy] niezwykłych akronimów. Kanadyjka podkreśla, że dla zwolenników wiadomości tekstowych ważnym kryterium akceptowalności jest częstotliwość występowania słowa.
    • By KopalniaWiedzy.pl
      Ludzie posługują się obecnie tysiącami języków, jednak niewykluczone, że wszystkie one pochodzą od jednego wspólnego przodka. Najnowsze badania na polu lingwistyki komparatywnej wskazują, że praźródłem wszystkich lub prawie wszystkich współczesnych języków może być wspólny język.
      Naukowcy zwracają uwagę, że przed mniej więcej 50 000 lat ludzkość nagle dokonała pewnego skoku w sposobie zachowania. Pojawiły się bardziej zaawansowane narzędzia, rysunki naskalne, rzeźby. Zachowanie ówczesnego człowieka zaczęło przypominać nasze zachowania. Niewykluczone, że skok ten związany jest z pojawieniem się języka. Jeśli tak się rzeczywiście stało, to ówcześni ludzie, biorąc pod uwagę niewielką ich liczbę, mogli posługiwać się jedną, wspólną mową. Dotychczas jednak nikt nie próbował zbadać, jak mógł wyglądać ten pierwszy język ludzkości.
      Zadania tego podjęli się fizyk Murray Gell-Mann i antropolog Merritt Ruhlen.
      Gell-Mann to laureat Nagrody Nobla, którą otrzymał za badania nad cząstkami elementarnymi. Uczony zawsze, obok fizyki, pasjonował się też lingwistyką. Teraz ponad osiemdziesięcioletni emeryt postanowił bardziej zaangażować się w drugie ze swoich zainteresowań.
      Uczeni pracują nad stworzeniem drzewa języków, które doprowadziłoby ich do wspólnego przodka ludzkiej mowy. Dotychczas zrekonstruowali 220 węzłów w 8 różnych gałęziach oraz 22 pod- i podpodgałęziach. Węzły reprezentują języki. Ich praca polega na umieszczeniu na drzewie współczesnych języków i wykazaniu, z jakich starszych języków się one wywodzą. Gell-Mann i Ruhlen mają nadzieję, że w ten sposób dotrą do najstarszego z języków.
      Obaj naukowcy już w tej chwili uważają, że pierwszy z języków miał strukturę SOV czyli podmiot-dopełnienie-orzeczenie.
      Trzeba tutaj podkreślić, że ich prace są czysto teoretyczne oraz że nie wszyscy lingwiści zgodzą się z tym, iż w ten sposób uda się dowiedzieć czegokolwiek o najstarszych językach ludzkości.
    • By KopalniaWiedzy.pl
      Szerokość twarzy dyrektora generalnego wpływa na to, jak dobrze radzi sobie jego firma. Szefowie z szerszymi fizjonomiami zarządzają lepiej prosperującymi przedsiębiorstwami.
      Elaine M. Wong i Michael Haselhuhn z University of Wisconsin-Milwaukee oraz Margaret E. Ormiston z Londyńskiej Szkoły Biznesu badali, jak działają zespoły menedżerów najwyższego szczebla. Ze względu na zapracowanie nie dawano im do wypełnienia zestawów kwestionariuszy i trzeba było polegać na metodach niebezpośrednich. Amerykańsko-brytyjski zespół analizował listy do udziałowców oraz sprawdzał, jak wykształcenie i cechy demograficzne szefów oddziałują na poziom funkcjonowania firmy. Psycholodzy zdecydowali się także na uwzględnienie szerokości twarzy szefa, ponieważ kilka wcześniejszych studiów wykazało, że stosunek jej szerokości i długości jest powiązany z agresją. Sam Haselhuhn zademonstrował nie tak dawno temu, że mężczyźni o szerokich twarzach są bardziej skłonni oszukiwać partnerów w czasie negocjacji i kłamać, by zwiększyć zyski. Czują się też obdarzeni większą mocą, co ma swoje dobre strony, ponieważ mają tendencję do patrzenia na problem raczej z perspektywy całościowej niż do skupiania się na szczególikach. Dzięki temu łatwiej im nie tracić z oczu zadania. Wong podejrzewała, że poczucie mocy może wpływać na wyniki finansowe firmy, stąd pomysł, by zmierzyć na zdjęciach twarze 55 dyrektorów generalnych z rankingu Fortune 500. Pod uwagę wzięto tylko mężczyzn, gdyż w przypadku kobiet stosunek szerokości do długości twarzy nie wpływa na zachowanie (wygląda więc na to, że chodzi o oddziaływania testosteronu).
      Okazało się, że dyrektorzy z szerszymi twarzami osiągali o wiele lepsze wyniki finansowe od kolegów z węższymi fizjonomiami. Analizując listy do udziałowców, psycholodzy zauważyli, że wpływ szerokości twarzy szefa modyfikuje jeden istotny czynnik: wizja świata kierownictwa najwyższego szczebla. Zespoły menedżerskie hołdujące czarno-białej wersji świata w większym stopniu ulegały autorytetowi szefa niż zespoły skłaniające się ku szarej wizji rzeczywistości. Nic więc dziwnego, że szerokość twarzy dyrektora liczyła się w tych pierwszych o wiele bardziej.
    • By KopalniaWiedzy.pl
      Długość telomerów wpływa na ryzyko rozedmy płuc – twierdzą naukowcy ze Szkoły Medycznej Uniwersytetu Johnsa Hopkinsa (American Journal of Respiratory and Critical Care Medicine).
      W badaniach na myszach odkryliśmy, że u tych, które miały krótsze telomery, ryzyko wystąpienia rozedmy w wyniku ekspozycji na dym papierosowy było znacznie wyższe – wyjaśnia dr Mary Armanios.
      Telomery zabezpieczają chromosomy przed uszkodzeniami podczas kopiowania. Po każdym podziale komórki stają się coraz krótsze. Z wiekiem jest coraz więcej krótkich telomerów i komórki przestają się dzielić, dlatego telomery można uznać za zegary biologiczne. Chcieliśmy stwierdzić, czy ich długość sama w sobie wyjaśnia następujący w miarę starzenia wzrost podatności na rozedmę płuc.
      Podczas półrocznego eksperymentu naukowcy wystawiali myszy ze skróconymi telomerami na działanie dymu papierosowego przez 6 godzin dziennie pięć dni w tygodniu. Później zbadano tkankę płuc oraz funkcje oddechowe zwierząt. Choć na początku gryzonie nie miały żadnej choroby płuc, w wyniku kontaktów z dymem tytoniowym niespodziewanie rozwinęła się u nich rozedma. U myszy z długimi telomerami nic takiego nie nastąpiło.
      Odkryliśmy, że komórki z uszkodzonym DNA przestawały się dzielić, a komórki płuc ze zbyt dużą ilością uszkodzeń nie mogły być zreperowane, przyczyniając się tym samym do rozwoju rozedmy. To jeden z najklarowniejszych przykładów [wpływu] długości telomerów, która jest czynnikiem dziedzicznym. Do tego dołącza się wpływ środowiska, np. palenie papierosów.
      Rozedma to przewlekła choroba płuc, w której występuje powiększenie powierzchni powietrznych położonych obwodowo w stosunku do oskrzelików końcowych. Prowadzi to do destrukcji ścianek tych struktur. Widoczne jest nadmierne upowietrznienie płuc i zmniejszenie liczby pęcherzyków płucnych. Zmiany rozedmowe są powszechne u starszych osób. Niekiedy występują u ludzi, którzy nigdy nie palili, jednak najpowszechniejsze są u palaczy. Wyniki badań na myszach sugerują, że u pewnych pacjentów krótkie telomery mogą się przyczyniać do przyspieszenia starzenia płuc przez dym papierosowy.
      Wcześniej zespół Armanios ustalił, że skrócenie telomerów powoduje idiopatyczne włóknienie płuc (ang. idiopathic pulmonary fibrosis, IPF), któremu u części chorych towarzyszy właśnie rozedma. Częstość występowania obu chorób rośnie z wiekiem i z liczbą lat palenia tytoniu. Połączenie długości telomerów z obiema chorobami to klarowna wskazówka, że dzielą one mechanizm patologii […].
      W przyszłości Amerykanie planują testy kliniczne z udziałem ludzi.
    • By KopalniaWiedzy.pl
      Naukowcy z Australii i Hiszpanii pracują nad uniwersalnym testem na inteligencję. Ponieważ jego rozwiązanie nie wymaga posługiwania się językiem, mogłyby go rozwiązywać najprzeróżniejsze istoty i byty, np. zwierzęta, programy komputerowe czy przedstawiciele obcych cywilizacji. Co więcej, dałoby się porównywać ich IQ.
      Dwoma czołowymi przedstawicielami zespołu są informatycy David L. Dowe z Monash University oraz José Hernández-Orallo z Universitat Politècnica de Valencia. Biorąc pod uwagę ich specjalność, nie powinno dziwić odwołanie do algorytmicznej teorii informacji, znanej również jako teoria Kołomogorowa-Chaitina. Bazuje ona na twierdzeniu sformułowanym przez XVIII-wiecznego matematyka Thomasa Bayesa. Jednym ze stosowanych w jej obrębie pojęć jest złożoność Kołomogorowa (in. złożoność algorytmiczna). Jest ona definiowana jako najkrótszy możliwy program, definiowany za pomocą długości kodu binarnego, który może doprowadzić do konkretnego rezultatu. Obowiązującą regułą jest więc zasada minimalnej długości kodu – spośród dostępnych hipotez uczeń wybiera tę, która zapewnia najlepszą kompresję danych. Zastosowanie algorytmicznej teorii informacji do inteligencji pozwala przedstawić IQ jako złożoność Kołomogorowa najbardziej skomplikowanego zadania, jakie ktoś rozwiązał. W praktyce uzyskanie dokładnego wyliczenia złożoności algorytmicznej jest mało prawdopodobne, ale można porównywać przybliżenia.
      Podczas testu stosowane ma być warunkowanie instrumentalne, zwane również warunkowaniem sprawczym. Badany uczy się metodą prób i błędów relacji między swoim działaniem a konsekwencjami. W ten sposób zmienia się prawdopodobieństwo/częstotliwość różnych zachowań. W zależności od tego, kogo poddawano by testowi, nagrodą za właściwe działanie byłyby np. pieniądze (człowiek), banany (małpa) czy liczba punktów (program komputerowy). Gdyby chodziło o rozpracowanie gry w kółko i krzyżyk przez kogoś, kto nigdy się w to nie bawił, najpierw należałoby ustalić, że wygraną oznaczają trzy takie same znaki w rzędzie. Jeśli badany opanowałby reguły, przeszedłby na wyższy poziom. Porażka oznaczałaby spadek na niższy poziom i łatwiejsze zadanie. Szympans, który nie przeszedłby zadania z kółkiem i krzyżykiem, mógłby sobie np. poradzić z podobnym zadaniem zawierającym pojedynczą linię znaków.
      Hernández-Orallo i Dowe nie zamierzają wykorzystywać już istniejących gier. Zgodnie z ich pomysłem, nowe gry i wzorce generowałby komputer. Naukowcy uważają, że pozwoli to wyeliminować ludzkie błędy i uprzedzenia oraz uzyskać zadania o dowolnym poziomie złożoności. W tym nierozwiązywalne dla człowieka...
×
×
  • Create New...