Category:

Далеко простирает лингвистика руки свои в дела человеческие!

Сподобился я в последнее время смотреть лингвистические ролики ПостНауки (на скорости 1.5x или выше, разумеется, как и любые другие по-русски, а то беда).

В частности, один из роликов назывался Машинный перевод, корпус эротических рассказов и феминитивы // Интервью с Александром Пиперски (замечу кстати, что Пиперски — голова, ему палец в рот не клади).

Так вот, в части, посвященной компьютерному анализу частотности слов в корпусе эротических рассказов (начиная с 25:00), Пиперски анализирует особенности частотности общей лексики в зависимости от категории рассказа (потому что частотность специфической лексики будет варьироваться однозначно), выясняя, какие обычные слова языка значимо чаще встречаются в той или иной категории (26:10).

(26:30) Например, если посмотреть на категорию рассказов про гомосексуальность, то там очень высоко стоит слово "невольно".


Дальше он делает из этого наблюдения некоторые выводы, и их, наверное, можно сделать несколько разных, но, оказывается, из какого сора растут социокультурные наблюдения, не ведая стыда!

This entry was originally posted at https://spamsink.dreamwidth.org/1150400.html. Please comment there using OpenID.