С 13 по 18 апреля 2015 года в Бурятском государственном университете состоялся семинар по языковым технологиям (Ulaan-Ude Language Technology Course 2015), организованный кафедрой филологии Центральной Азии Восточного института Бурятского государственного университета совместно с Центром языковых технологий для саамского языка (Giellatekno) Арктического университета Норвегии (Университет Тромсё) и Университетом Хельсинки. Целью семинара являлась подготовка фундамента для разработок в области языковых технологий бурятского и других сибирских языков. Занятия вели проф. Центра языковых технологий для саамского языка (Giellatekno) Тронд Тростеруд (Trond Trosterud) и исследователь Арктического университета Норвегии и Университета Хельсинки доктор Фрэсис Тайерз (Francis Tyers). В начале семинара были даны краткие сведения о языковых технологиях, их важности как для исследователей, так и носителей языка, была представлена инфраструктура Giellatekno, также было дано краткое введение в UNIX и svn. Базовые сведения о составлении лингвистических анализаторов в инфраструктуре Giellatekno с использованием lexc и twolc были даны на примере бурятского языка. Затем участники семинара работали в языковых группах, разрабатывая анализаторы для бурятского, халха-монгольского, письменного ойратского (тодо), тувинского, хакасского и эвенкийского языков. В ходе семинара был составлен конвертер с внутреннемонгольской латиницы для "ясного" письма на письменный ойратский, а также конвертер для перевода бурятского текста в фонематическую запись. Таким образом, участники семинара получили базовые теоретические знания и непосредственный практический опыт, достаточный для планирования и разработки морфологического анализатора. В ходе семинара перед участниками с он-лайн докладом выступил Джонатан Вашингтон, лингвист-тюрколог и монголовед из Университета Индианы в Блумингтоне, Центр Евразийских исследований (известный во всем мире центр монголоведных исследований). Заключительное занятие семинара было посвящено вопросам дальнейшего использования морфологических анализаторов, в частности был продемонстрирован опыт приложения тувинского анализатора для машинного перевода с казахского на тувинский язык в системе Apertium, который поддерживается корпорацией Google. Семинар завершился презентацией проектов по созданию трансдьюсеров (морфологических анализаторов) для отдельных языков и обсуждением дальнейших планов каждой из групп.
Все участники выразили заинтересованность в продолжении разработки морфологических анализаторов для своих языков в рамках инфраструктуры Giellatekno. Организаторы и участники семинара с энтузиазмом восприняли идею о регулярном проведении данного мероприятия и создания тематической сети в рамках Университета Арктики по разработке языковых технологий для языков региона.