
Двое ведущих ученых-компьютерщиков выиграли Премию Тьюринга 2024 года за свою работу в области обучения с подкреплением, дисциплине, в которой машины учатся через метод проб и ошибок с наградой, позволяющий им адаптироваться в ограниченных или динамических средах.
Андрю Г. Барто, профессор-эмерит Университета Массачусетса в Амхерсте; и Ричард С. Саттон, профессор Университета Альберты, разработали ключевые алгоритмы и теории через ряд важных статей, начиная с 1980-х годов. Это включает работу по методу обучения с подкреплением, называемому временная разница в обучении; позже дуэт опубликовал учебник под названием Обучение с подкреплением: Введение.

'Нобелевская премия в области компьютерных наук'
Премия Тьюринга, управляемая Ассоциацией вычислительной техники (ACM), часто называется "Нобелевской премией в области компьютерных наук". Однако Нобелевская премия сама начала затрагивать область вычислений, особенно в области искусственного интеллекта; Джефф Хинтон и Джон Хопфилд получили Нобелевскую премию по физике за свою работу в области основного искусственного интеллекта в прошлом году. Это было последовано награждением Нобелевской премии по химии Демису Хассабису и Джону Джамперу из DeepMind за их работу над AlphaFold.
Барто и Саттон поделятся призом в $1 миллион, который был предоставлен при поддержке Google.