Борис Мефодьевич Лобанов | |
---|---|
Дата рождения | 18 июля 1938[1] (80 лет) |
Место рождения | Прокопьевск, Кемеровская область, Россия |
Страна |
![]() |
Научная сфера | компьютерный анализ, синтез речи, распознавание речи |
Место работы | Объединённый институт проблем информатики Национальной академии наук Беларуси |
Альма-матер | Минский радиотехнический институт |
Учёная степень | доктор технических наук |
Награды и премии | Нагрудный знак «Почётный радист СССР»; 1 серебряная і 2 бронзовые медали ВДНХ СССР; Юбилейная медаль «В честь 80-летия Национальной академии наук Беларуси» |
Бори́с Мефо́дьевич Лоба́нов (род. 18 июля 1938, Прокопьевск, Кемеровская область, Россия) — белорусский учёный в области технической кибернетики[2]. Разработал теоретические основы и методы анализа, синтеза и распознавания речи. Разработал первые в СССР устройства для синтеза русской и белорусской речи[3]. Автор более 300 научных работ по проблемам анализа, распознавания и синтеза речи[4][5][6]. Автор трёх глав первого справочника по искусственному интеллекту, изданного в СССР, посвящённых системам речевого общения[7]. Совершил ряд изобретений в данной сфере[8].
Борис Мефодьевич Лобанов родился 18 июля 1938 года в городе Прокопьевск Кемеровской области. В 1948 году семья переехала в Минск на постоянное место жительства[9].
Уже в школе Борис Лобанов увлекся конструированием радиоаппаратуры: в 6-м классе построил свой первый детекторный радиоприемник, в 8-м – ламповый, а в 10-м сконструировал собственную УКВ-радиостанцию. В 1955 году окончил среднюю школу № 13 города Минска и окончательно определился в выборе своей будущей специальности[10][9].
В это время в Минске не существовало вуза подходящего профиля, и Борис Лобанов поступил на отделение «Радиосвязь и радиовещание» Минского электротехникума связи. В техникуме он продолжал оставаться радиолюбителем, организовал первые Республиканские радиосоревнования по «охоте на лис», получил первый разряд по радиоспорту и удостоверение радионаблюдателя за сигналами первого спутника Земли[9].
После окончания техникума в 1958 году Борис Лобанов получил диплом с отличием, но вместо продолжения учебы в вузе был призван на срочную службу в Советскую армию в должности старшего радиомастера (Петрозаводск). Уже в 1959 году, имея достаточную специальную подготовку и хорошо оборудованную приборами радиомастерскую, Борис Лобанов занялся исследованием речи, изучая его с помощью микрофона и осциллографа. В то же время он вступил в переписку с известным учёным, профессором Л. А. Чистович, от которой получил ряд ценных советов по проведению исследований речи. Сохранилась документальная запись в дневнике Лобанова, датированная 25 октября 1959 года: «Фонемофон ведет к фонемографу». Из этой записи видно, что уже тогда Борис Лобанов осознал и определил генеральную стратегию своих будущих речевых исследований: «К распознаванию речи через синтез», которой неизменно придерживался всю дальнейшую научную деятельность[9].
После окончания службы в армии в 1961 году Борис Лобанов поступил в Минский радиотехнический институт (МРТИ) на специальность «Радиотехника» и уже на первом курсе стал председателем студенческого научного общества института, в рамках которого вместе с группой студентов начал разработку анализатора речевых сигналов. В 1965 году, будучи студентом четвертого курса, Лобанов опубликовал свои первые четыре научные работы по анализу речевых сигналов, которые были засчитаны как дипломный проект, что позволило ему закончить институт досрочно. Предложенный в этих работах метод улучшения основных параметров параллельного спектрального анализа эффективно использовался затем при разработке систем распознавания речи[9].
Закончив в 1965 году МРТИ, Борис Лобанов поступил в аспирантуру института и продолжил работать над задачами первичного анализа речевых сигналов для систем распознавания и синтеза речи. В 1968 году он закончил аспирантуру и защитил кандидатскую диссертацию по теме «Некоторые вопросы анализа речевых сигналов»[11].
Ещё обучаясь в аспирантуре, в 1966 году Б.М. Лобанов организовал хозрасчетную научную лабораторию анализа и синтеза речевых сигналов при кафедре радиоприемных устройств МРТИ, многие из сотрудников которой еще длительное время продолжали заниматься речевыми исследованиями. В лаборатории под руководством Лобанова впервые в СССР были сконструированы спектроанализатор для речевых исследований «Спектр-1» и прибор для интонографических исследований речи «Интонограф». В это же время в лаборатории проводились исследования методов автоматического выделения фонетических признаков звуков речи, например таких, как «шумный», «звонкий», «гласный», «взрывной». На их основе впервые в СССР было разработано устройство распознавания речевых команд «Сезам-1», отмеченное серебряной медалью ВДНХ СССР[11].
Во второй половине 60-х годов ХХ века Б.М. Лобанов принял участие в решении фундаментальной проблемы распознавания речи, связанной с нелинейными искажениями временной оси в процессе произнесения звуков речи. Такого рода искажения создавали существенные трудности при сопоставлении произносимых слов с их эталонами в процессе распознавания речи. В 1968 году независимо и практически одновременно Г.С. Слуцкер (Московский государственный научно-исследовательский институт радио) и Т.К. Винцюк (Институт кибернетики АН УССР) для решения данной проблемы предложили воспользоваться методом динамического программирования (ДП-методом)[11]. В 1969 году Б.М. Лобанов в соавторстве с Г.С. Слуцкером опубликовал статью, в которой было дано дальнейшее развитие ДП-метода для исключительно важного практического случая, когда границы распознаваемого слова неизвестны, т. е. для решения задачи обнаружения и распознавания звукосочетаний в непрерывном речевом сигнале. ДП-метод получил в дальнейшем широкое признание зарубежных исследователей[12].
На следующий год после успешной защиты диссертации, в ноябре 1969 года Б.М. Лобанов был направлен на научную стажировку сроком на 10 месяцев в Великобританию. Стажировку по проблемам анализа речевых сигналов Б.М. Лобанов проходил под руководством профессора К. Чери в Имперском колледже науки и технологии (Лондон), а по проблемам синтеза речи – под руководством профессора Р. Лоренца в Эдинбургском университете[12].
После прохождения стажировки в Великобритании основным направлением научной работы Б.М. Лобанова стала разработка методов и устройств синтеза речи по тексту. Еще во время стажировки в Эдинбургском университете им были проведены успешные эксперименты по синтезу звуков русской речи, позволившие заложить основы формантного синтеза речи по фонемному тексту. В результате уже в 1972 году под руководством Б.М. Лобанова был разработан первый в СССР синтезатор русской речи «Фонемофон-1», отмеченный двумя медалями ВДНХ СССР[12].
В 1973 году Б.М. Лобанову присвоено звание «старший научный сотрудник». В связи с открывающимися перспективами внедрения речевых технологий в отрасли «Связь» на работы Б.М. Лобанова по синтезу русской речи обратило внимание руководство Московского отделения Центрального научно-исследовательского института связи (ЦНИИС). В результате в 1974 году на базе Минского отдела ЦНИИС была открыта Лаборатория речевых систем, руководителем которой Б.М. Лобанов оставался последующие 15 лет. Основным направлением работ лаборатории являлось развитие методов и создание систем автоматического распознавания и синтеза речи, ориентированных на их практическое использование в отрасли «Связь»[13].
Наряду с практической деятельностью по созданию речевых диалоговых систем Б.М. Лобанов уделял большое внимание научно-организационной работе. В 1976 году он организовал и провел в Минске Всесоюзную школу-семинар «Автоматическое распознавание слуховых образов» (АРСО), на которой присутствовало более 200 участников из 75 различных научных организаций СССР. Школа-семинар АРСО проводилась регулярно (каждые два года) до 1991 года, а Б.М. Лобанов с 1976 года входил в постоянно действующий программный комитет АРСО. На семинаре участникам АРСО в Минске был впервые продемонстрирован прототип телефонной справочной системы с синтезированным речевым ответом[14].
В 1978 году Лобанов по приглашению французских ученых был направлен в двухмесячную командировку во Францию для научной работы и ознакомления с работой ведущих научных центров речевых исследований: университетов в Париже, Нанси и Экс-ан-Провансе, а также речевых лабораторий в Тулузе, Гренобле, Орсее и Ланионе. В период пребывания во Франции Лобанов принял участие в конференции по речевой связи и был принят в члены Акустического общества франкоязычных стран[14].
В 1979 году Б.М. Лобанов представлял на Всемирной выставке «Телеком-79» в Женеве новую модель синтезатора речи – «Фонемофон-3», отмеченную дипломом выставки. Известный фантаст Артур Кларк, посетив павильон СССР и ознакомившись с синтезатором речи, записал в книгу отзывов: «Вы предвосхитили мои фантазии из фильма „Космическая одиссея 2001 года“»[14][15], а швейцарская газета «Обозреватель» опубликовала статью: «Теперь русские изучают иностранные языки с помощью компьютера, который говорит». За комплекс работ по созданию синтезаторов речи в 1981 году Лобанову присвоено звание «Почетный радист СССР»[14].
В начале 1980-х годов Б.М. Лобанов начал развивать предложенный им метод артикуляторно-формантного синтеза речи по тексту, который был положен в основу нового поколения синтезаторов речи. В 1983 году Б.М. Лобанов в соавторстве с В.Я. Кучеровым издал книгу «Синтезированная речь в системах массового обслуживания»[16].
К началу 1984 года Лобанов создал окончательную формулировку и осуществил теоретическую и экспериментальную разработку единого лингвоакустического подхода к решению проблемы синтеза речи по тексту. Разработанные методы и алгоритмы их реализации легли в основу докторской диссертации «Исследование и разработка методов автоматического синтеза речи по фонемному тексту», которую Лобанов успешно защитил в 1984 году в Институте электроники и вычислительной техники Академии наук Латвийской ССР в Риге. Позднее полученные теоретические и экспериментальные результаты были адаптированы для систем синтеза речи на других европейских языках. В частности, к 1987 году была разработана англоязычная версия синтезатора, демонстрировавшаяся на Всемирном конгрессе фонетических наук и получившая высокую оценку англоязычных специалистов[17].
На 80-е годы ХХ века приходится период создания первых промышленных систем синтеза и распознавания речи и их широкого внедрения в отрасли «Связь» СССР при непосредственном участии Б.М. Лобанова и его коллег – Б.В. Панченко, Н.П. Дегтярёва, В.П. Афанасьева. В Калининградском ПО «Кварц» была проведена опытно-конструкторская разработка с последующим серийным производством речевого терминала «Марс-1», включающего подсистемы распознавания речи «Сезам» и синтеза речи «Фонемофон». На базе речевого терминала «Марс-1» была разработана система автоматического информирования абонентов междугородной телефонной сети (АИАМТС) о задолженности за переговоры. Система АИАМТС была успешно внедрена и длительное время эксплуатировалась в ряде крупных городов: Минске, Новосибирске, Алма-Ате, Фрунзе, Петропавловске-Камчатском. Другая система – система контроля за параметрами аппаратуры телефонных и радиостанций с оперативным оповещением дежурного персонала о возникших неполадках – была внедрена на Минской, Московской и Зеленоградской АТС, а также на Белорусской республиканской радиоретрансляционной станции РТС-5[18].
В 1988 году Б.М. Лобанов поступил на работу в Институт технической кибернетики АН БССР по приглашению директора института В.С. Танаева и возглавил вновь созданную Лабораторию распознавания и синтеза речи. Переход Б.М. Лобанова в Институт технической кибернетики совпал по времени с появлением первых персональных компьютеров (ПК) и в планах работ лаборатории появилась тематика, связанная с оснащением ПК системами речевого ввода-вывода информации. Формантный метод, который долгое время играл ключевую роль в системах синтеза речи по тексту, не подходил для этой цели из-за необходимости большого объема вычислений в реальном времени. В 1989 году Б.М. Лобановым был предложен новый микроволновой метод (МВ-метод) синтеза речевых сигналов, в котором вместо вычислений формантных колебаний использовался подготовленный заранее набор микроволн естественного речевого сигнала. Под руководством Б.М. Лобанова МВ-метод был реализован сотрудником лаборатории А.Н. Ивановым в синтезаторе «Фонемофон-5». Компактность его программного обеспечения (всего 64 Кб) позволила оснастить синтезом речи уже первые IBM PC/XT и даже отечественные ПК ЕС-1840. Синтезатор речи был востребован во многих практических приложениях незрячими пользователями. В дальнейшем на основе МВ-метода были разработаны версии для чешского и польского языков, а также автономный одноплатный модуль синтеза речи, украинскоязычная версия которого некоторое время работала на линии киевского метро[19].
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .