14:59

28.07.2011 в 11:00Пишет  Diary best:
Пишет  Taho:

Google изучил эволюцию языка за двести лет
Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist (Google's 'fossil record' digitises 5 million books).


До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.



Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году это число возросло до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов. 



Вот, например, изменение частоты употребления слова "амбиции"с 1920 по 2000 годы:




читать дальше

URL записи

Не свое | Не Бест? Пришли лучше!



URL записи

Комментарии
28.07.2011 в 20:28

Слюшай, а интересно!

Прямо показывает историю человечества практически=)
29.07.2011 в 19:06

угу, лингвист во мне прям возликовал от такой классной штуки)))

Расширенная форма

Редактировать

Подписаться на новые комментарии
Получать уведомления о новых комментариях на E-mail