Книги и переводы в контакте: как мы ВКонтакте делаем собственный переводчик / Хабр

Содержание

как мы ВКонтакте делаем собственный переводчик / Хабр

Машинный перевод — область технологий, которая успешно приближает будущее. Он разрушает языковой барьер и помогает людям, которые говорят на разных языках, понимать друг друга. Один клик — и можно прочитать и понять статью, написанную на незнакомом языке, или сообщения в мессенджере от людей из любой точки мира. А значит, получить больше информации и найти новых знакомых. Это с точки зрения пользователя.

Со стороны разработчиков сервисов тоже, казалось бы, современное машинное обучение уже близко к тому, чтобы достаточно было сделать import model_name from your_favourite_framework — и всё заработало. К сожалению, это не совсем так. Нельзя просто взять готовый претрейн и надеяться, что он будет хорошо переводить все именованные сущности. Нельзя просто обучиться на готовом кусочке WMT‑данных и верить в то, что переводчик будет адекватно работать на специфичном домене. Нельзя просто взять обычный токенизатор и трансформер — и рассчитывать на корректный перевод текстов с шумами и опечатками.

Поэтому этот гайд будет немного более сложным, чем импорт моделей. Под катом вы не найдёте серебряной пули — только реальный опыт и подходы, которые помогли нам ВКонтакте справиться со всеми нюансами и запустить собственный переводчик.

ВКонтакте переводчик пригодится во многих направлениях. Например, мы можем мгновенно переводить сообщения в мессенджере. Или посты с русского на английский и другие языки: это помогает иностранцам знакомиться с уникальным для нашей соцсети контентом и находить для себя что‑то потенциально интересное. Кроме того, мы можем привлечь новых пользователей с помощью автоматических переводов постов, отдавая их в выдачу поисковиков.

При этом переводчик — не только удобный инструмент для рядового пользователя. Машинный перевод стал базой для всей современной обработки естественного языка. Именно для него изначально придумывали рекуррентные сети, sequence‑to‑sequence модели, аттеншен, трансформеры, которые теперь применяются в самых разных сферах машинного обучения.

Что выбрать, когда нужен автоматический перевод

Сейчас существует множество решений, чтобы затащить машинный перевод в свой продукт. У каждого свои плюсы и минусы. Прежде чем решить, что использовать, необходимо взвесить все за и против.

#1: Облачное решение

Самый простой и надёжный вариант — купить готовое облачное решение у опытных вендоров. Это может быть Яндекс, Google, DeepL — все они умеют хорошо переводить на большое количество языков. У них вы найдёте большинство популярных языковых пар, быстро подключитесь к удобному API и ни о чём не будете переживать. Но любое удобство стоит денег: нужно заранее оценить количество запросов и возможные всплески нагрузки — они могут обойтись вам очень дорого.

#2: Открытые модели

Такой вариант отлично подойдёт тем, кто собирается переводить тексты общих тематик и имеет достаточно ресурсов, чтобы хостить эти модели. В репозиториях Hugging Face’a можно найти множество самых разных моделей машинного перевода: начиная с классических en-ru моделей и заканчивая современными мультиязычными, способными переводить тексты с 200 языков. В качестве быстрого продакшен-решения можно воспользоваться готовым движком Argos, который тоже поддерживает много языковых пар и поставляется вместе с готовой API-обёрткой LibreTranslate.

По мере использования таких моделей могут проявляться недостатки. Например, качество переводов может сильно отличаться от коммерческих решений. Это становится заметнее на специфических и нестандартных доменах. Например, если переводчик обучался на legal-текстах, вряд ли он сможет хорошо переводить мемы и повседневную речь. Дело здесь не только в различии лексики. Модели могут впитать смещённые знания о мире и начать некорректно переводить некоторые сущности в заданных контекстах.

Все эти ошибки можно пытаться исправлять костылями и хардкодингом. Но в какой-то момент оказывается, что проблем настолько много, что легче всё сделать с нуля.

#3: Обучаем свои модели

Третий вариант требует глубоких технических знаний, ресурсов на сбор данных и разработку моделей. Но в результате вы получаете огромный опыт и удобный инструмент, с помощью которого сможете вносить любые правки в модели и точнее управлять поведением переводчика.

Для нас именно разработка собственного решения стала оптимальным вариантом, так как:

  • у нас огромное количество данных для перевода и высокая нагрузка — так что покупка готового решения оказалась бы дороже, чем разработка собственного;

  • открытые решения, которые мы тестировали в ранних версиях продукта, в наших условиях и на нашем домене быстро проявили свои недостатки, проблемы и уязвимости.

Поэтому вскоре мы начали разработку собственного решения. Дальше расскажу об опыте, полученном в процессе.

Гайд по созданию собственного переводчика

Сейчас в задачах машинного перевода чаще всего используются решения на основе нейронных сетей. Для их работы нужны два базовых компонента: токенайзер и нейросетевая модель. Токенайзер разбивает текст на маленькие сущности — токены, которые потом передаются на обработку в нейросетевую модель. Токенами могут быть целые слова, их небольшие части или отдельные символы. Существует несколько алгоритмов токенизации, каждый из которых обладает своими достоинствами и недостатками. Чуть больше про них можно почитать в хорошем обзоре от Hugging Face.

В качестве нейросетевой модели мы используем трансформер типа «энкодер‑декодер». Энкодер вычисляет внутреннее представление исходного текста, на основе которого декодер генерирует перевод. За деталями работы этой архитектуры можно обратиться к оригинальной статье или подробному объяснению с картинками.

Немного о предобученных моделях

Упростить разработку переводчика можно с помощью больших предобученных мультиязычных моделей. Для задач перевода лучше всего подходят архитектуры типа «энкодер‑декодер», например mBART и mT5. Эти модели можно взять за основу и дообучить их на своём небольшом корпусе. Плюсы такого подхода — быстрая сходимость во время обучения и более высокое качество, так как эти модели уже знают структуру языка и им достаточно выучить взаимосвязь между языками.

Другие предобученные модели, такие как LaBSE и LASER, могут использоваться для аугментации и фильтрации данных, речь о которых пойдёт дальше.

Мультиязычные претрейны типа M2M и NLLB могут стать хорошей отправной точкой для ваших исследований. Они покрывают большой набор языковых пар, плюс в оригинальных работах можно найти множество нюансов и тонкостей обучения нейросетевых переводчиков.

Какую бы вспомогательную модель мы ни использовали, важно обращать внимание на то, под какими лицензиями они распространяются и какие есть ограничения на их использование.

Данные для машинного перевода

Данные — очень важная часть любой задачи машинного обучения. Итоговое качество переводов чаще зависит от количества и чистоты данных, чем от каких-то архитектурных излишеств моделей. Усилия по разметке и очистке данных приносят гораздо больше пользы, чем аналогичный объём работы по улучшению модели. Секрет хорошего нейросетевого переводчика — большой и чистый корпус.

Bitext-корпусы

Основной тип данных для обучения переводчика — это bitext-корпусы, состоящие из пар текстов «оригинал — перевод». Такие данные можно размечать самим, но для этого потребуется штат профессиональных переводчиков, много времени и ресурсов. Часть данных можно найти в открытом доступе: например, есть хорошие большие агрегаторы OPUS и Statmt.org. Для автоматизации поиска данных можно пользоваться утилитой mtdata.

Однако открытые корпусы часто страдают от большого количества шумов и сильного смещения домена. Например, один из крупнейших корпусов UNPC состоит из официальных и юридических текстов. Используя только такой корпус, сложно научиться хорошо переводить повседневную речь или художественную литературу.

Mono-корпусы

Другой полезный источник — это mono-корпусы, состоящие из большого объёма обычных текстов. Чаще всего нас интересуют данные, близкие к нашему домену, которые относительно легко найти в открытом доступе. На основе mono-корпусов мы предобучаем разные вспомогательные модели, начиная с токенизаторов и заканчивая большими языковыми претрейнами типа BART и T5. Самые популярные и доступные источники таких данных: mC4 и Common Crawl.

Нужно больше данных, милорд

Bitext mining может пригодиться, если у вас есть ещё один источник данных — полупараллельные тексты. Например, русско-английский перевод книги «Война и мир» Льва Толстого. Очевидно, что профессиональный переводчик при работе с текстом адаптирует его, меняет порядок предложений и их структуру. Если бы мы захотели собрать из такого книжного перевода параллельный корпус, последовательно сопоставляя предложения, то ничего хорошего бы не получилось.

Мы сможем решить эту проблему, если воспользуемся энкодерами типа LASER или LaBSE. Особенность их работы заключается в том, что чем ближе два предложения на разных языках по смыслу, тем ближе будут их эмбеддинги в векторном пространстве. Посчитав эмбеддинги для каждого предложения из оригинала, сможем поискать ближайшие эмбеддинги предложений в переводе книги. Затем по некоторому порогу близости векторов выбрать пары, которые являются переводом друг друга.

Авторы, предложившие такой подход, делали свой поиск внутри огромного корпуса Common Crawl и снапшотов Википедии, и поделились с нами новыми крупными датасетами CCMatrix и WikiMatrix. Для поиска пар переводов на таких обширных корпусах требуются большие вычислительные мощности. Мы, в свою очередь, можем немного упростить задачу и искать пары в заведомо известных полупараллельных корпусах: ими могут быть переводы отдельных книг, статей, новостей и публикаций.

Прогоняем предложения через LaBSE и ищем ближайшие по косинусной близости

Улучшить качество переводов и немного адаптировать домен помогает back-translation. В основе этого метода лежит очень простая идея: «давайте переведём обратным переводчиком текст на другой язык, после чего развернём получившуюся пару». Тогда у нас появятся семплы «плохой перевод» — «хороший оригинал», которые можно добавить к основной обучающей выборке. Такой подход может помочь нам значительно увеличить обучающий корпус и улучшить обучение модели: чистые target-side тексты помогут нам качественнее обучать языковую модель на стороне декодера, а грязные source-side тексты помогут сделать энкодер более устойчивым к разным шумам.

Важно правильно подбирать соотношение между back-translated и основной частью обучающих данных. Кроме этого следует добавлять source-side токен к back-translated данным, показывающий модели, что эти данные являются сгенерированными. Такие лайфхаки помогают стабильнее учить переводчик и снижать вероятность переобучения.

Чистка данных

В любом корпусе текстов для переводов могут присутствовать шумы. Чтобы улучшить качество переводчика и стабилизировать обучение, нужно фильтровать плохие пары переводов. Чаще всего это делается с помощью разных эвристик: соотношения длины исходного и переведённого текста или словарных символов к символам пунктуации; степенью word-alignment связности или величиной энтропии языковой модели; близостью эмбеддингов мультиязычных кодировщиков типа LaBSE или LASER.

В открытых корпусах часто можно встретить синтетические переводы, появившиеся в результате работы старых автоматических переводчиков. Обучение на таких текстах плохо влияет на качество переводчика, поэтому их тоже важно фильтровать. Чаще всего это делают с помощью отдельного классификатора, который обучают на заранее собранном датасете.

Большая часть описанных фильтров есть в репозитории OpusFilter — там их можно изучить или вдохновиться на написание собственных скриптов фильтрации.

Препроцессинг и постпроцессинг данных

С одной стороны, когда мы обучаем нейронную модель, стараемся использовать достаточно чистые и структурированные данные, чтобы получать качественный перевод целого текста. С другой — в реальности с текстом может произойти что угодно и работать модели придётся совсем в других условиях. Пользователь может писать текст с ошибками или опечатками, периодически нажимать Caps Lock, вставлять ссылки, даты, произвольные числа. Такие сущности плохо влияют на нейронную модель: она может начать игнорировать часть сущностей или, наоборот, их чрезмерно повторять. Помимо этого, в тексте могут присутствовать элементы разметки и меншены, которые нужно переводить с учётом контекста и оставлять разметку целостной. Поэтому, чтобы наш автоматический перевод хорошо работал в реальных приложениях, нужен дополнительный препроцессинг и постпроцессинг данных.

Сделать препроцессинг помогут два подхода: с использованием word-alignment’ов и служебных токенов.

Word-alignment модели находят взаимосвязь между словами в исходном и переведённом тексте. На вход они получают два текста, а на выходе отдают пары лексически связанных слов. Из готовых решений наиболее известны статистические fast-align, eflomal и нейросетевая SimAlign.

Алгоритм следующий:

  1. Нормализуем все сущности и запоминаем их положение в исходном тексте: слова, написанные заглавными буквами, привести к нижнему регистру, именованные сущности заменить на служебные, избавиться от разметки.

  2. Очищенный текст переводим нейросетевой моделью.

  3. Вычисляем word alignments.

  4. Восстанавливаем сущности: на основе полученных word alignments ищем связанные токены и их позиции в переведённом тексте. Далее придаём им исходный вид: восстанавливаем заглавное написание, именованные сущности и вставляем разметку.

Выделенными сущностям здесь может быть что угодно: ссылки, меншены, капс, глоссарии

Служебные токены — это токены, которые остаются неизменными и занимают подходящее место в переводе. Например, токен [mask] может использоваться для маскирования ссылок. Заменив в исходном тексте ссылку на [mask], мы ожидаем встретить этот токен в переводе, чтобы после поставить на его место исходную ссылку.

Точно так же можно решить задачу частичного перевода с помощью глоссариев. Для этого оставим служебный токен на месте слова, который мы потом переведём с помощью статичного глоссария. После того как нейронная модель завершит свою работу, мы найдём в переведённом тексте этот служебный токен и вставим на его место словарный перевод.

Для вложенных сущностей и CAPS’а можно ввести токены границ [ls] и [rs]. Будем отмечать ими нужные регионы в исходном тексте, чтобы затем восстановить разметку в переводе.

Чтобы служебные токены выполняли свою задачу, обучающий корпус необходимо аугментировать. Для этого можно использовать модели word-alignment’а и маскировать случайный набор связанных слов служебными токенами.

Маскируем все, что хотим однозначно увидеть в переводе. На постпроцессинге возвращаем сущности на свои места

Инференс моделей

После успешного обучения моделей стоит задуматься о том, как эти модели использовать в продакшен-среде. Для ускорения и оптимизации инференса PyTorch- / Flax- / Tensorflow-модели следует сконвертировать в ONNX, TensorRT или CTranslate2 в зависимости от рабочего окружения. Последний — удобный фреймворк для инференса трансформеров типа «энкодер-декодер» и «декодер» (encoder-decoder transformer & decoder-only transformer) с поддержкой различных ускорений. В некоторых случаях может пригодиться дистилляция и квантизация моделей.

Для хостинга моделей лучше всего использовать микросервисную архитектуру, где каждый отдельный сервис отвечает за инференс отдельной языковой пары, и отдельная часть занимается препроцессингом и определением исходного языка. В таком случае будет гораздо проще масштабировать систему в зависимости от языковых потребностей пользователей.

Собираем всё вместе: пошаговый гайд о том, как обучить свой переводчик

  1. Сперва необходимо понять, какую продуктовую задачу будет решать сервис автоматического перевода. В зависимости от этого принимаем решение: покупать ли облачный сервис, использовать открытые модели или разрабатывать что-то своё.

  2. Начинаем собирать всевозможные данные. Ищем открытые корпусы, занимаемся bitext minig’ом и разметкой собственных датасетов. Анализируем свой текстовый домен и подбираем наиболее подходящие mono-корпусы.

  3. Подготавливаем всё для обучения: очищаем корпусы, готовим логику препроцессинга, аугментируем данные и обучаем токенизаторы.

  4. На основе собранных данных обучаем первые версии нейронных моделей. Следим за метриками, подбираем гиперпараметры. Делаем несколько итераций аугментации данных с помощью back-tranlsation’а.

  5. Дописываем препроцессинг и постпроцессинг данных. Тестируем финальное качество переводов и исследуем возникающие corner-кейсы.

  6. Подготавливаем модели к выкатке в продакшен. Занимаемся конвертацией и оптимизацией моделей, разработкой микросервисов, собираем воедино весь пайплайн переводов.

  7. После выкатки моделей работа не заканчивается. Дальше нас ждёт бесконечный процесс доразметки данных, оптимизаций, правки багов перевода и переобучения моделей.

Получается, что если разложить всё по полочкам и разобраться, то окажется, что сделать собственный переводчик вполне реально. Всегда есть много разных вариантов: и облака, и открытые решения, и что-то самописное.

Разные продуктовые задачи требуют разных решений. Для нас расчёты показали, что разработка собственного решения окупается примерно за неделю, если сравнивать с использованием облачных сервисов, и позволяет получить потенциально неограниченную пропускную способность и гибкость.

Законна ли записывать аудиоверсии книг и выкладывать в интернете?

⚡ Все статьи / ⚡ Споры

Елена Мехоношина

Аудиокниги, записанные без покупки лицензии и залитые в интернет — это так же незаконно, как пиратский фильм в сети. То же самое касается аудиоверсий чужих учебников и курсов. Исключение — книги давно умерших писателей и открытые лицензии. Теперь про всё по порядку.

Содержание

  • Аудиокниги записывают с согласия автора или издательства
  • Что будет за самовольную начитку и публикацию в интернете
  • Какие литературные произведения можно записывать свободно

Аудиокниги записывают с согласия автора или издательства

С точки зрения закона, аудиокнига — это фонограмма простой книги. А ещё — это производное произведение. Автор озвучки берёт текст — первоначальное произведение, делает запись чтения, и получается фонограмма — производное произведение. 

Родной брат фонограммы — перевод книги или статьи с одного языка на другой. Перевод тоже производное произведение, для него те же правила.

Для озвучки русской книги надо купить права у автора. На русскоязычные версии книг зарубежных писателей — у автора перевода. И ещё стоит знать, что популярная и, казалось бы, старая книга не становится автоматом общественным достоянием — п. 63 Обзора судебной практики по защите интеллектуальных прав от 23.09.2015 г. Про сроки перехода книг в общественное достояние скажем ниже.

С автором книги заключают лицензионный договор и платят деньги. В договоре прописывают, что лицензиат получает право создавать и публиковать фонограмму литературного произведения. Даже если автор согласен отдать книгу на озвучку бесплатно, с него нужно взять письменное согласие. Правила — из ст. 1260, 1270, 1286, 1323 ГК РФ.

Статья: договор на приобретение исключительных прав

Есть цель заработать на озвучке или нет — неважно. Разбираться с авторскими придётся и для аудиокниг, которые будут скачивать за деньги, и для аудиоверсий учебников в некоммерческий проект для школьников. 

Представим, что мы хотим сделать аудиокнигу романа «Пищеблок» Алексея Иванова. Для этого с Ивановым надо подписать лицензионный договор с правом делать фонограмму. Когда аудиокнига будет готова, мы станем авторами производного произведения — фонограммы романа «Пищеблок». Теперь мы можем зарабатывать на продажах аудиокниги и включать её школьникам на уроках литературы. За пиратский слив книги в сеть можем потребовать блокировку торрента и денежную компенсацию.

Часто писатели продают все права на книгу издательству. И по условиям лицензии озвучивать книгу имеет право только издатель. Это называется исключительной лицензией. Издатели сами приглашают людей на создание фонограммы книги.  Записать свою аудиоверсию в таком случае не получится. 

Озвучивать учебные курсы, учебники, научные статьи и любой другой авторский текст тоже можно только с согласия авторов. Это результат творчества, он под охраной закона — ст. 1259 ГК РФ, п. 80 Постановления Пленума ВС РФ от № 10.

Что будет за самовольную начитку и публикацию в интернете

Взять дома с полки книгу, начитать на диктофон и включить бабушке — не криминально. О нарушении авторских просто никто не узнает. Проблемы возникнут, если выложить книгу в интернете или как-то ещё довести до широкого круга слушателей.

Писатель или издательство могут через суд заблокировать книгу на торренте, ютубе и в поисковике и взыскать компенсацию от 10 000 до 5 000 000 ₽ — ст. 1252, 1301 ГК РФ.

К примеру, издательство «Эксмо» купило лицензию на публикацию, перевод и озвучку романа «Тёмный лес» писателя Лю Цысинь. Когда «Эксмо» нашли на двух торрентах аудиоверсии романа, они через суд заставили Гугл заблокировать этот контент — дело № 3-618/2019.

В этом деле крайним остался Гугл. Он информационный посредник и отвечает за публикацию пиратского контента, только без оплаты компенсации. Но на его месте мог быть автор озвучки или владелец сайта с аудиокнигами. Им пришлось бы платить издательству деньги за нарушение авторских прав.

Новым ИП — год Эльбы в подарок

Год онлайн-бухгалтерии на тарифе Премиум для ИП младше 3 месяцев

Попробовать бесплатно

Какие литературные произведения можно записывать свободно

Без покупки лицензии и согласия автора можно озвучивать книги из общественного достояния.  

Общественное достояние в России — это книги писателей и переводчиков, которые умерли больше 70 лет назад. Отсчёт 70 лет начинают с 1 января года после смерти автора, а если книга написана совместно — после смерти последнего автора. Для репрессированных писателей 70 лет отсчитывают с 1 января года, следующего за годом реабилитации. Для участников Великой Отечественной войны срок увеличивается до 74 лет — ст. 1281, 1282 ГК РФ.

К примеру, роман «Бесы» Достоевского можно спокойно начитывать на диктофон и выкладывать в сеть. Писатель умер в 1881 году, его романы в общественном достоянии. 

Ещё согласие автора не нужно, если он сам выложил книгу в открытый доступ и прямо разрешил переработку. Это называется открытой лицензией — ст. 1286.1 ГК РФ. 

Но тут надо внимательно смотреть, чтобы автор разрешил создавать новое произведение на основе своего или напрямую разрешил озвучку. Книгу, которую автор выложил с пометкой, мол, для бесплатного чтения, озвучивать нельзя. Рекомендуем искать вид открытой лицензии Creative Commons с добавлением надписи Attribution-ShareAlike.

Статья актуальна на 

Продолжайте читать

Все статьи

Суд взыскал компенсацию за контрафакт с мультперсонажами. Что можно спросить с поставщика?

Как снизить компенсацию за музыку в кафе, мультперсонажей в товарах и чужие фото

Сотрудники расписываются за ИП: в чём риски?

«Космические захватчики» Ноны Фернандес [Почему эта книга должна победить] « Three Percent

Ежедневно проверяйте наличие новых сообщений «Почему эта книга должна победить», охватывающих все тридцать пять названий, вошедших в лонг-лист премии «Лучшая переведенная книга 2020 года».

Крис Кларк вырос в Западной Канаде и в настоящее время живет в Филадельфии. Его переводы включают книги Риада Жиро, Пьера Мак Орлана и Франсуа Карадека. Его перевод книги Марселя Швоба « воображаемых жизни

» был удостоен премии Французско-американского фонда переводов в области художественной литературы в 2019 году., а его перевод романа лауреата Нобелевской премии Патрика Модиано « В кафе потерянной молодежи » стал финалистом той же премии в 2017 году. В настоящее время он занимается повторным переводом романа Раймона Кено для публикации в 2022 году (NYRB Classics).

Космические захватчики Нона Фернандес, перевод с испанского Наташа Виммер (Graywolf Press)

Чем воспоминания отличаются от снов? Конечно, сны все перемешаны, построены из щепок и осколков, и их комбинаторные нарративы, если их вообще можно так назвать, заимствованы из любого восприятия, пережитого или нет. Им нельзя доверять. Воспоминания должны быть более конкретными, более линейными, более основанными на фактах. Но так ли это? Когда я думаю о своих юных годах, у меня мало воспоминаний, а некоторые из тех, что я могу вспомнить, с тех пор вызывают у меня подозрения.

Я помню огромную плакучую иву перед нашим домом, когда я только учился кататься на велосипеде. Велосипед был красно-белый с длинным банановым сиденьем. Я совершенно уверен в этом. Еще раньше я помню своего рода хобби-лошадку, красочно разрисованную синими и красными пятнами на белом, которую я получил в одно рождественское утро. И все же, перебирая старые альбомы во время визита на родину, я наткнулся на фотографию, которая лежит в основе этих воспоминаний. Я больше не верю, что у меня есть истинные воспоминания о лошади или о том рождественском утре, но вместо этого мой разум включил детали этой фотографии в свои резервуары и построил воспоминание из этих деталей. Добавьте к этой неуверенности другие воспоминания, которые, несомненно, являются результатом того, что мне неоднократно рассказывали историю из моего собственного детства, и становится трудно сказать, что является памятью, а что внутренней литературной или кинематографической конструкцией.0003  

Space Invaders — четвертый роман Ноны Фернандес, впервые опубликованный в Чили в 2013 году. С тех пор она опубликовала еще два романа. Еще один в растущем списке звездных переводов Наташи Виммер, Space Invaders , представляет собой запутанное исследование того, как коллективная память формируется во время крупномасштабных травмирующих событий. Фернандес представляет многослойные и фрагментарные воспоминания группы молодых одноклассников о «политицидных» годах диктатуры Пиночета в Чили. Как и их воспоминания, хронология повествования фрагментарна и непоследовательна: детям около десяти лет, а им около 19.84; дети уже не дети, им чуть за сорок; или, им около двадцати, примерно в то время, когда средства массовой информации объявили судебные решения по делу Caso Degollados

, «делу о перерезанном горле», которое снова привлекло внимание общественности к ужасным убийствам. Будь то десять, двадцать или сорок лет, их мысли всегда сосредоточены на одном и том же временном периоде, пытаясь создать смысл из того, что они помнят, что говорят им факты, что они с тех пор узнали и не узнали.

Люди помнят вещи по-разному; моя жена почти всегда помнит свои сны, и, кажется, у нее есть подробные воспоминания о своем детстве, которых нет у меня. Эта изменчивость памяти очевидна и у Мальдонадо, и у ее друзей. Не только в том, что они помнят, но и в том, как они это помнят. Но есть одна общая точка зрения, которую они все разделяют, девушка, которая стала звездой травматического психологического кинофильма их юности. Несмотря на то, что она является общей чертой всех их воспоминаний, все они помнят ее по-разному. Один помнит ее волосы, заплетенные в длинные косы, другой клянется, что ее темные волосы были длинными и распущенными, обрамляющими ее лицо. Они не могут договориться о деталях, но ее место в их памяти точно:

Это она. Ничто другое не имеет значения, ни стиль ее волос, ни цвет ее кожи, ни ее глаз. Все относительно, кроме звука ее голоса, потому что во сне, по словам Фуэнзалиды, голоса подобны отпечаткам пальцев. Голос Гонсалеса просачивается в нас из снов Фуэнсалиды, вторгается в наши собственные видения, в наши собственные версии Гонсалеса, обосновывается и составляет нам компанию ночь за ночью.

Фернандес рисует эту загадочную центральную фигуру, Эстреллу, с чертой этого сна, щепоткой этого воспоминания, из того, из более позднего, из после. Тонкие и не очень тонкие повторения и модуляции придают форму ключевым сценам и отношениям. Сильные визуальные воспоминания занимают центральное место у членов этой группы, и эти поразительные элементы также смешиваются и складываются. Запасные руки родителя с ампутированными конечностями тревожно сливаются со снарядами их видеоигры Space Invaders. Непревзойденный рекорд, оставленный в качестве испытания исчезнувшим старшим братом. Таинственный мужчина в темных очках и на красном «Шевроле» плывет на заднем плане, словно дым. История построена из образов, а образы написаны словами. «Мальдонадо мечтает о письмах. Это старые письма, написанные почерком десятилетних девочек. […] Мальдонадо мечтает прочитать каждое из этих писем. Сны состоят из слов, собранных из букв и предложений». Наше понимание беспокойного прошлого основано на сомнительных свидетельствах, переплете газетных вырезок, умственных несоответствиях и воспоминаниях из детства.

Мастерство Наташи Виммер проявляется в этом переводе благодаря ее вниманию к регистру и тону. Среди различных воспоминаний, снов и попыток объяснений Фернандес перемежает серию коротких писем от одного из одноклассников другому, и здесь проявляется внимание Виммера к деталям. Она сообщила мне, что для нее трудность заключалась в том, чтобы найти «правильное сочетание лирики и детской искренности». И действительно, так оно и есть, поскольку письма очаровательны, но не инфантильны. Устройства такого рода рискуют загромождать книгу, особенно такой длины, но в

Space Invaders , эти эпистолярные артефакты памяти являются случайными якорями времени невинности, которое исчезло под тяжестью осознаний, с которыми позже столкнулись персонажи.

То, что я должен тебе сказать, совсем другое. Более важные вещи, секретные вещи. Но эта бумага крошечная, а мой текст такой большой и толстый. Папа говорит, что мне нужно писать помельче и придерживаться линий, но линии такие тонкие, что их трудно разглядеть. Если бы я послушался отца, я мог бы написать больше, но так как я не могу писать мелкими строчками и останавливаться на крошечных строчках, мне приходится писать меньше. Я должен стараться слушаться отца.

Помимо букв становится все труднее отличить говорящих друг от друга, определить, кто из них рассказывает о событиях, быть уверенным в том, помнят ли они или видят сон. Тщательно продуманные повторы помогают связать некоторые вещи воедино, а также еще больше размывают хронологические линии. Это состав коллективной памяти поколения во времена общей травмы, и это происходит в возрасте становления. Как многие из нас в последнее время видели, в трудные времена память и сон, как правило, пересекаются больше, чем обычно. Сны окрашивают воспоминания, а коллективные воспоминания тянут и тянут во всех направлениях одновременно.

Наши десятилетние сыновья и дочери, должно быть, испытывают нечто подобное прямо сейчас, в эти общие дни беспокойства и неуверенности, вызванные пандемией. В то время как мы все застряли в помещении, у многих из нас проблемы со сном или, возможно, проблемы со сном , а не . В такой ситуации сны могут принимать новые формы, поскольку из-за отсутствия рутинных и типичных стимулов в них вторгаются старые воспоминания, телевидение и книги, новости. Какие воспоминания формирует наше молодое поколение об этих необычных днях? Что они будут помнить о великой пандемии 2020 года? Дом, полный тревог? Скука? Исчезновение любимого человека, при котором они не смогли присутствовать? Когда мы подойдем к другой стороне этого, все они разделят воспоминания об этом времени, о том, каково было быть десятью весной 2020 года. Каждый из них будет помнить это по-своему, они сохранят разные детали, но вместе они будут обладать общим опытом, потому что все они прошли через это одновременно.

Это не означает, что COVID-19 можно сравнить с авторитарной военной диктатурой и полным крахом демократии, или что эта пандемия будет продолжаться семнадцать лет. Я лишь предполагаю, что между ними есть сходство в том, что касается формирования коллективной памяти во время травмы. И в каком-то смысле, несмотря на всю тревогу и страх, с которыми мы сталкиваемся в такой неожиданной и невообразимой ситуации, есть что-то смутно утешительное в осознании того, что все остальные имеют дело с какой-то версией того же самого, в большей или меньшей степени. Так было с Мальдонадо, Суньигой и их друзьями, и это встречается в прозе Космические захватчики . Как выразилась Наташа Уиммер: «Есть что-то во множественном числе от третьего лица, что просто идеально подходит для этой точки зрения ребенка — может быть, потому, что в детстве мы с большей вероятностью чувствуем себя частью коллектива».

Несмотря на то, что для романа такого объема необычно получить крупную награду, поскольку он составляет менее восьмидесяти страниц, даже при таком объеме короткая книга Фернандеса представляет собой полностью сформированный читательский опыт. Здесь более чем достаточно удовольствия, самоанализа и стиля, чтобы подтвердить выбор копии. Это одно- или двухразовое чтение, и поэтому нет никаких причин, по которым вам не следует погрузиться и испытать эту проницательную медитацию о памяти, сновидениях и травмах. В качестве дополнительного бонуса он может придать вашим мечтам о пандемии немного остроты в виде светящихся зеленым рук-снарядов.

Теги: Крис Кларк, Graywolf Press, Наташа Уиммер, Нона Фернандес, космические захватчики, почему эта книга должна выиграть

Руководство по чтению: Time Shelter Георгия Господинова, перевод Анжелы Родель

Синопсис

«Клиника прошлого», управляемая загадочным терапевтом, предлагает многообещающее лечение для страдающих болезнью Альцгеймера: каждый этаж воспроизводит десятилетие в мельчайших деталях, перенося пациентов назад во времени в знакомый, более безопасный и счастливый момент.

Безымянному рассказчику поручено собрать обломки прошлого, от мебели 1960-х и пуговиц от рубашек 1940-х до запахов и даже дневного света. Но по мере того, как комнаты в клинике становятся все более убедительными, все больше здоровых людей ищут там убежища, надеясь избежать ужасов современной жизни — развитие событий, которое приводит к неожиданной загадке, когда прошлое начинает вторгаться в настоящее. Вскоре целые страны захотят подражать этой идее, и будут проводиться референдумы, чтобы решить, какая конкретная версия прошлого будет определять будущее каждой нации.

Замысловато созданный и красноречиво переведенный Анжелой Родель, Приют Времени укрепляет репутацию Георгия Господинова как одного из незаменимых писателей нашего времени и главного голоса в международной литературе.

Георгий Господинов

© Фелия Барух

Главные герои

Гаустин

Загадочный Гаустин — терапевт, специализирующийся на расстройствах памяти, таких как болезнь Альцгеймера и деменция. Описанный как «бродяга во времени», он создает радикальную клинику прошлого в Цюрихе, где люди с такими расстройствами могут укрыться в комфорте своих воспоминаний, но вскоре понимает, что его идея имеет гораздо более широкий потенциал.

Рассказчик

Рассказчик от первого лица ведет Time Shelter . Первоначально безымянный, по мере развития истории становится все яснее, что рассказчик, вероятно, является вымышленной версией самого автора, Георгия Господинова. Со временем рассказчик становится помощником Гаустина, путешествуя по странам, чтобы приобрести артефакты 20-го века для клиники, которые помогают воссоздать прошлое.

Time Shelter Георгий Господинов, перевод Анжелы Родель

Об авторе и переводчике

Георгий Господинов родился в Ямболе, Болгария, и его произведения были переведены на 25 языков. Самый известный современный писатель Болгарии, чьи работы включают поэзию и пьесы, Господинов был номинирован на более чем дюжину международных премий в области художественной литературы, включая Литературную премию ПЕН-клуба за перевод, Премию Грегора фон Реззори, Брюкке Берлин Прейс и Дом дер Kulturen der Welt Literaturpreis. Он получил премию Яна Михальски в области литературы в 2016 году, премию Яна Михальски в 2019 году. Среди прочих премия Angelus Literature Central Europe и Premio Strega Europe 2021.

Анжела Родель — музыкант и литературный переводчик, живет и работает в Болгарии. Родель имеет ученые степени Йельского университета и Калифорнийского университета в Лос-Анджелесе, а также получил переводческие гранты NEA и PEN. Ее перевод книги Георгия Господинова «: Физика печали » получил премию AATSEEL 2016 года за литературный перевод. В 2014 году она получила болгарское гражданство за переводческую деятельность и вклад в болгарскую культуру.

Анжела Родель

Что сказали судьи Международной Букеровской премии

«Изобретательный, подрывной и болезненно-юмористический роман о национальной идентичности и соблазнительных опасностях памяти и ностальгии.

«Часть традиции Центрально-Восточной Европы, в которую входят Милан Кундера, Дубравка Угрешич и Данило Киш, представляет собой свежую постановку старых вопросов: опасность избирательной памяти, наследственность травмы и то, как ностальгия может овладеть обществом. и стать комфортным одеялом – или раком.

‘Это заставляет нас подвергнуть сомнению наши представления об идентичности: не только национальной, индивидуальной, социальной, но также исторической и временной. Насколько мы перекраиваем прошлое, чтобы оно соответствовало нашему настоящему и нашему будущему? Помимо границ, разделяющих страны, мы видим, что время и память также являются разными формами границ. Как люди, нации и даже континенты решают, что помнить, а что забыть? Роман также заставляет по-иному осмыслить само понятие Времени. Ностальгия больше, чем раньше.

‘Остроумие и изобретательность письма никогда не перевешивают сострадание автора не только к своим героям, но и к нам, читателям.

‘Когда ты играешь со временем, время тоже играет с тобой. Поскольку это замысловатый роман, каждый элемент которого тесно связан с другим, и мы не хотим никому его портить, все, что мы скажем: прочтите книгу!» 

Подробнее о комментариях судей читайте здесь.

судьи Международной Букеровской премии 2023 года: Парул Сегал, Фредерик Штудеманн, Уиллеам Блэкер, Лейла Слимани и Тан Тван Eng

© Хьюго Глендиннинг

Что сказали критики

The Guardian: 

‘[Господинов] может вытягивать полномерных персонажей из разрозненных деталей их разрозненных воспоминаний. Его переходы – между юмором и грустью, абсурдным ситуационизмом и звучным трагизмом, пафосом и ироничной наблюдательностью – никогда не бывают навязчивыми. Благодаря мастерству и деликатности перевода Анжелы Родель эти качества в изобилии проявляются англоязычному читателю».

The New York Times:

«Моральность искусственного возвращения людей в прошлое и более широкий вопрос о том, действительно ли это приносит утешение — является ли потакание ностальгии целительным или пагубным — является центральным вопросом новой книги Георгия Господинова. переведенный роман. Он сочувствует остроте прошлого… но отвергает козлов отпущения глобализма, иммиграции и модернизации, которые якобы убили их; мы все соучастники разрушения истории, и движение назад может означать только нетерпимость и возвеличивание традиционалистского китча…»

The Los Angeles Review of Books:

‘Что правда, так это то, что мы настолько боимся будущего, что не можем даже вернуться в прошлое. Вместо этого мы выбрали инерцию по любому количеству вопросов. О российской агрессии. Об изменении климата. Не лучше ли было бы разрушить наше будущее и жить без связи с прошлыми десятилетиями по нашему выбору? Господинов отмечает, что возвращение упущенного времени, искупление невосполнимого тоже обходится дорого. А наш нынешний мир не хочет платить ни за одну вещь, и поэтому мы ждем без крова, надеясь, что все будет хорошо».0005

The Times:

«Это не реалистический роман. Это во многом разрушающий жанр роман идей. Это книга о памяти, о том, как она угасает и как восстанавливается, даже заново изобретается в воображении заблудших людей и в гражданском дискурсе наций. Господиново видение завтрашнего дня — это кошмар, от которого Европа знает, что должна проснуться. А случайность в сочетании с собственными достоинствами книги, возможно, просто создала классику».

Мы так боимся будущего, что даже не можем уйти в прошлое. Вместо этого мы выбрали инерцию по любому количеству вопросов. О российской агрессии. Об изменении климата

Что сказал автор и переводчик

Я из системы, которая продавала светлое будущее при коммунизме. Теперь ставки сместились, и популисты продают светлое прошлое. Я на своей шкуре знаю, что оба чека отскакивают, они ничем не обеспечены

Что сказал автор

«Мое желание написать эту книгу возникло из-за ощущения, что что-то пошло не так в часовом механизме времени. Можно было уловить запах беспокойства, витающий в воздухе, можно было потрогать его пальцем. После 2016 года мы словно жили в другом мире и в другом времени. Распад мира с посягательством популизма и разыгрыванием карты «великого прошлого» в США и Европе меня спровоцировал. Brexit был другим триггером. Я из системы, которая продавала «светлое будущее» при коммунизме. Теперь ставки сместились, и популисты продают «светлое прошлое». Я на своей шкуре знаю, что оба чека отскакивают, они ничем не обеспечены.

‘И поэтому я хотел рассказать эту историю о «референдумах о прошлом», проводимых каждой европейской страной. Как жить с дефицитом смысла и будущего? Что мы делаем, когда нас охватывает пандемия прошлого? Последняя глава романа описывает, как оживает прошлое: войска и танки, собранные для воссоздания начала Второй мировой войны, неожиданно вторгаются на территорию соседней страны. Роман опубликован на болгарском языке в 2020 году.

«Идея перехода от клиник прошлого, которые имеют дело с личным прошлым пациентов/резидентов, к европейским референдумам о прошлом была основной основой сюжета с самого начала. . Но я из тех писателей, которые любят следить за языком и самими историями. Я думаю, что язык умнее нас. Я из поэзии, поэтому мне дорого каждое слово. Я пишу свои романы предложение за предложением. И если я могу дойти до того, что следую голосу рассказчика, его языку и ритму, и даже иногда удивляю себя тем, как разворачивается история, это хорошо для книги.

‘Мне не нравятся романы, написанные по типу Периодической таблицы, где автор с самого начала знает, что будет в каждой коробке. Я хочу, чтобы история волновала меня, была естественной и человеческой, не переходила из точки А в точку Б, а вместо этого терялась и находила. Кроме того, роман о потере памяти (как личной, так и коллективной) не мог быть иным».

Полное интервью Георгия Господинола читайте здесь.

Что сказал переводчик

«Мы с Георгием работаем вместе уже несколько лет — я перевел его предыдущий роман, а также множество рассказов, эссе, пьес, даже либретто космической оперы (!). Наше тесное сотрудничество всегда было восхитительным и интеллектуально вдохновляющим; несмотря на свою довольно устрашающую эрудицию, Георгий также необычайно чуток и щедр на свое время и знания. Георгий стал поэтом, поэтому он очень интересуется ремеслом перевода и любит проникать в дебри ритма и звука.

‘Возможно, один из забавных моментов при работе над этой книгой был в обсуждении разных эпох — меня смутило, почему он охарактеризовал 80-е как десятилетие диско, ведь я, ребенок, родившийся в начале 70-х, у меня есть отчетливые воспоминания о танцах в подвале дома моих родителей под лихорадку субботнего вечера в то десятилетие. Мы поняли, что несоответствие было связано с тем, что западные музыкальные тенденции прорвались через железный занавес с небольшим отставанием, поэтому действительно 80-е действительно были эпохой диско в Восточном блоке. Поэтому мы нашли способ улучшить текст, добавив уточнение: «Вы всегда говорите, что 80-е — это десятилетие, которое произвело на Востоке в основном скуку и дискотеку».

Прочитайте полное интервью Анжелы Родель здесь.

Вопросы и темы для обсуждения

Главный герой книги, Гаустин, которому принадлежит идея клиник прошлого, — загадочная, загадочная и харизматичная фигура, и рассказчику часто трудно его понять. «Я никогда не был уверен, когда он шутил и шутил ли он вообще» (стр. 44). Начнем с того, что он кажется провидцем, предлагающим радикальную и успешную форму терапии. Позже в книге рассказчик называет его «монстром». Вы нашли Гаустина симпатичным персонажем или опасной и злобной фигурой, или и тем, и другим?

В интервью для веб-сайта Букеровской премии Георгий Господинов сказал, что его карьера была вдохновлена ​​«рассказами [моей] бабушки, которые я слушал в детстве. Истории, которые смешали вымысел и реальность, без четкого конца одной и начала другой. Истории, в которых были голоса, шепот и чудеса в конце». Видите ли вы эти влияния в Приюте Времени ?

В нескольких местах книги рассказчик, который является автором, упоминает, что он изобрел или придумал Гаустина. Он называет Гаустина своим «невидимым другом, более реальным и видимым, чем я сам». И рассказчик, и Гаустин имеют общие инициалы Г.Г. и болгары (как Георгий Господинов). Насколько два главных героя и автор книги — один и тот же человек? Считаете ли вы метафизические элементы книги удачными?

Роман можно читать как все более диковинную сатиру об идеализации прошлого современным обществом и опасностях такого мировоззрения в массовом масштабе. Это своевременное чтение, которое, по словам Guardian , касается «оружия ностальгии». Согласны ли вы с тем, что мы живем в эпоху, когда ностальгия стала оружием?

Жюри Международной Букеровской премии назвало книгу «болезненно юмористической». Как использование автором юмора и иронии способствует книге в целом?

В какой-то момент истории Гаустин отступает в 1939 год, который упоминается в начале книги как «конец человеческого времени». Конец книги также опирается на этот момент. Почему Господинов все время возвращается к этой дате?

La Repubblica описал Господинова как «Пруста, пришедшего с Востока». Согласны ли вы с этим утверждением? В чем сходство двух писателей?

Выдержка из одной из научных работ Гаустина гласит: «Чем больше общество забывает, тем больше кто-то производит, продает и заполняет освободившиеся ниши эрзац-памятью. Легкая промышленность памяти. Прошлое из легких материалов, пластиковая память словно выплевывается на 3D-принтере. Память в соответствии с потребностями и потребностями». В какой степени вы согласны с мнением Гаустина?

Клиника Гаустина предлагает возможность не только пережить собственное прошлое, но и альтернативное прошлое, которое человек мог бы пожелать; прошлое, в котором им отказано. «Прошлое — это не только то, что случилось с тобой. Иногда это то, что вы только что вообразили» (стр. 47). В какой мере Господинов обыгрывает мысль о том, что мы можем ностальгировать по чему-то, чего мы не испытали или чего никогда не было?

Английское название является неологизмом, как и оригинальное болгарское название романа. Какой смысл вы уловили из этого, если таковой имеется? Как вы думаете, с какой целью автор и переводчик выбрали это название?

Приют Времени Георгий Господинов в переводе Анджелы Родель

Ресурсы и дополнительная литература

New York Times : Что, если бы мы могли заново пережить наши золотые века? https://www.nytimes.com/2022/05/10/books/review/georgi-gospodinov-time-shelter.html

Жестяной дом : Подкаст между обложками
https://tinhouse.com/podcast /georgi-gospodinov-time-shelter/

The New Yorker: Болгарская печаль Георгия Господинова
https://www.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *