Een decennia-oude theorie zegt dat woorden die we frequent gebruiken kort zijn, denk maar aan de lidwoorden, de persoonlijke voornaamwoorden, enz.
Klinkt logisch, nu hebben onderzoekers aan het MIT toch even een andere theorie getoetst, namelijk dat de lengte van de woorden (in dit geval in het Engels en 10 andere Europese talen) gelinkt is aan de hoeveelheid informatie dat het woord bevat. Hiervoor maakten ze gebruik van documenten die op Google gepubliceerd werden, waarbij ze eerst en vooral zich concentreerden op een databank van ondertitels.
Abstract van de paper van Steven T. Piantadosi, Harry Tily, and Edward Gibso :
“We demonstrate a substantial improvement on one of the mostcelebrated empirical laws in the study of language, Zipf’s 75-y-oldtheory that word length is primarily determined by frequency of use. In accord with rational theories of communication, we show across 10 languages that average information content is a much better predictor of word length than frequency. This indicates that human lexicons are efficiently structured for communication by taking into account interword statistical dependencies. Lexical systems result from an optimization of communicative pressures, coding meanings efficiently given the complex statistics of natural language use.”