В 1939 году писатель Эрнест Винсент Райт опубликовал роман «Гэдсби». Книга, не отличавшаяся захватывающим сюжетом, тем не менее, стала одним из уникальных явлений зарубежной беллетристики ХХ столетия. Просто в труде Райта было более 50 000 слов, но ни одно из них не содержало буквы «е». Дело в том, что «Гэдсби» – это роман-липограмма. Текст, в котором полностью отсутствует один или несколько звуков (букв).
Жорж Перек, французский писатель и кинорежиссёр, член экспериментальной литературной группы УЛИПО (объединение писателей и математиков, поставившее своей целью научное исследование потенциальных возможностей языка) спустя почти 30 лет написал приключенческий увертюрный роман-липограмму «Исчезание», в котором тоже не было ни слова с «е» – самой популярной во французском алфавите буквой. Идея Перека была в том, чтобы показать: литература работает со словом так же, как с числами работает математика.
«Липограмма в переводе с греческого – «отсутствующая буква». Этому приему более тысячи лет. В мире литературы его изобретение равносильно открытию в математике нуля», – объясняют участники декабрьской научной программы.
Для них о связи математики и лингвистики провел лекцию кандидат филологических наук, преподаватель кафедры компьютерной лингвистики Института лингвистики РГГУ, научный сотрудник ВШЭ Александр Пиперски.
«Бывают среднестатистические тексты, а бывают такие, в которых чего-то неожиданно много или чего-то неожиданно мало. Что это за неожиданности, которые встречаются в текстах, и как из измерить? На лекции мы сыграли в игру «липограммы» и обсудили, насколько вероятно создать случайно текст, в котором напрочь отсутствует та или иная буква. И конечно поговорили о том, как математически посчитать и идентифицировать липограммы в большом массиве текстов», – рассказал педагог.
И действительно, мы привыкли к тому, что литература – это всегда чтение текстов и их анализ. А что если отказаться от такого разбора и переключиться на так называемое «дальнее чтение», то есть, взять очень много разных текстов и представить их с количественной точки зрения?
Исследовать литературу цифровыми методами, для извлечения из большого количества текстов каких-либо общих тенденций и закономерностей можно с помощью Национального корпуса русского языка (НКРЯ) – платформы, которая является самым главным инструментом современных лингвистов.
«Точки соприкосновения лингвистики и математики – самые неожиданные. И тем более я не думал раньше, что литературу можно выразить математически. Это интересный эксперимент: когда буквы уже не буквы, а рандомные номерные знаки, встречающиеся в тексте с определенной частотой», – отметил 14-летний Саша Каламбед из Москвы.
После лекции школьник решил принять предложение педагога и поучаствовать в традиционной олимпиаде по лингвистике. Принять участие в ней могут школьники 8-11 классов из любых городов России.
«Раньше она называлась олимпиадой по языковедению и математике. Она проводится более 50 лет и пропагандирует логические, математические аналитические подходы к языку и позволяет понять уникальные особенности языковых правил», – сказал Александр Пиперски.