Пионеры искусственного интеллекта получили Премию Тьюринга за работу по обучению с подкреплением

Двое ведущих ученых-компьютерщиков выиграли Премию Тьюринга 2024 года за свою работу в области обучения с подкреплением, дисциплине, в которой машины учатся через метод проб и ошибок с наградой, позволяющий им адаптироваться в ограниченных или динамических средах.

Андрю Г. Барто, профессор-эмерит Университета Массачусетса в Амхерсте; и Ричард С. Саттон, профессор Университета Альберты, разработали ключевые алгоритмы и теории через ряд важных статей, начиная с 1980-х годов. Это включает работу по методу обучения с подкреплением, называемому временная разница в обучении; позже дуэт опубликовал учебник под названием Обучение с подкреплением: Введение.

Андрю Г. Барто и Ричард С. СаттонИзображение: ACM

'Нобелевская премия в области компьютерных наук'

Премия Тьюринга, управляемая Ассоциацией вычислительной техники (ACM), часто называется "Нобелевской премией в области компьютерных наук". Однако Нобелевская премия сама начала затрагивать область вычислений, особенно в области искусственного интеллекта; Джефф Хинтон и Джон Хопфилд получили Нобелевскую премию по физике за свою работу в области основного искусственного интеллекта в прошлом году. Это было последовано награждением Нобелевской премии по химии Демису Хассабису и Джону Джамперу из DeepMind за их работу над AlphaFold.

Барто и Саттон поделятся призом в $1 миллион, который был предоставлен при поддержке Google.