Войти | Регистрация | Вход необходим для полного использования сайта
 +1.0 °C
Каждого влечет его страсть.
(Оноре де'Бальзак)
 

Чувашский язык: Паралельный корпус чувашского языка перешагнул через рубеж в 200 тысяч пар

Знакомства Доброе время суток. Меня зовут Владимир. Мне 32 года. Живу в городе Чебоксары. Л...
Знакомства Ищу мужчину от45 до 55 лет.ге пьющего...и чтобы руки росли откуда надо. Мне 53 .
Знакомства Познакомлюсь с простой,порядочной девушкой для создания семьи и с/о.
Ку хыпарпа эсир ҫавӑн пекех Чӑвашла паллашма пултаратӑр
Аçтахар Плотников 06.12.2019 00:27 | 1048 просмотров
Чувашский язык

Как сообщает лаборатория чувашского языка, основанная энтузиастами, в параллельном корпусе чувашского языка количество пар чувашско-русских предложений перевалило за 200 тысяч.

Параллельный корпус чувашского языка на данный момент создается для сбора параллельных текстов, на основе которых впоследствии энтузиасты хотят добавить чувашско-русский и русско-чувашский автоматический перевод в системы Яндекса, Гугла и т.д. В то же время идет и разработка своего собственного переводчика на основе нейронного алгоритма (ресурс будет готов в ближайшее время). На данный момент разработчикам удалось достичь качества в 24 BLEU (для сравнения: русско-английский перевод Яндекса и Гугла имеет качество 30–35 BLEU).

Как сообщают энтузиасты, для более качественного перевода необходимо собрать порядка миллиона пар. Работа по набору пар началась в апреле текущего года и за это время удалось довести их количество до 200 тысяч. В следующем году планируется довести количество до полумиллиона пар.

Работа в данном направлении ведется группой, куда входят энтузиасты: Николай Плотников (руководитель, разработка корпуса), Александр Антонов (специалист по машинному переводу), Светлана Трофимова, Эрбина Портнова, Алина Иванова (обработка текстов) и другие.

#чувашский язык, #достижения, #наука, #сайты

Еще больше интересных и актуальных новостей вы найдете в чувашской версии сайта!

Источник новости: http://corpus.chv.su/
 

См. также

Состоится презентация книги «Тюрки в истории мировой цивилизации»
2018, 12, 10
Попечительский совет Фонда сохранения и изучения языков РФ возглавил Николай Фёдоров
2019, 01, 30
На сайте электронных словарей пополнение — этимологический словарь чувашского языка
2019, 09, 17
Что такое ампулы уровня АКН
2019, 11, 14
Что такое электротехническая продукция
2019, 11, 26

Добавить новый комментарий

Ваше имя:
Ваш комментарий:
B T U T Заг1 Заг2 Заг3 # X2 X2 Ӳкерчĕк http://
WWW:
ĂăĔĕÇçŸÿ

Всего введено: 0 симв. Лимит: 1200 симв.
Если у вас все еще нет раскладки для печати текста на чувашском языке, ее можете взять ЗДЕСЬ.

Разрешенные Wiki тэги:

__...__ - выделение слова ссылой.

__aaa|...__ - выделение некого слова ссылкой на другое слово.

__http://ya.ru|...__ - выделение слова ссылкой на внешнюю ссылку.

**...** - выделение жирным.

~~...~~ - выделение курсивом.

___...___ - выделение подчеркиванием.


Новости недели

Orphus

Другие языки

Баннеры

Счетчики

 
О сайте | Помощь сайту | Статистика
(c) 2005-2017 Chuvash.Org | Номер свидетельства о регистрации в качестве СМИ: ЭЛ № ФС 77 - 68592, выдано 3 февраля 2017 года Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Содержимое сайта (кроме статей, взятых из других источников) публикуется на условиях CreativeCommons Attribution-ShareAlike 3.0. Вопросы по работе сайта: site(a)chuvash.org