Новое исследование, проведенное Сент-Эндрюсским университетом, показывает, что аудиторские практики, применяемые в финансовом секторе, способны помочь в обнаружении случаев научного мошенничества.
Причины отзыва статьи, ранее опубликованной в научном журнале, могут включать вопросы к этичности работы авторов: они могли допустить ошибки при проведении эксперимента или даже предоставить сфабрикованные данные, чтобы соответствовать выбранной модели. Несмотря на то, что всего 0,1% опубликованных работ обычно отзываются, а случаи преднамеренного мошенничества встречаются еще реже, каждый из них наносит существенный ущерб доверию общества к научным исследованиям.
Учитывая успешный опыт проведения финансовых аудитов, исследователи из Сент-Эндрюсского университета (Великобритания) предложили использовать закон Бенфорда для анализа относительного частотного распределения первых цифр чисел в наборах данных. Это поможет выявить случаи фабрикации данных и усилит меры по борьбе с мошенничеством в научных учреждениях и издательствах. Результаты исследования опубликованы в журнале Research Integrity and Peer Review.
Суть подхода заключается в том, что, согласно закону Бенфорда, законом первой цифры гласит, что вероятность появления определенной первой значащей цифры в реальных данных отличается от случайной (около 11%). Этот паттерн наблюдается при анализе разнообразных данных, таких как длина речных русел и цены акций: чем больше цифра, тем реже она встречается в начале числа.
По сути, открытый доступ к исходным данным позволяет любому человеку, используя закон Бенфорда, оценить их достоверность и определить, соответствуют ли они реальным значениям или были сфабрикованы авторами. Однако, как отмечают исследователи, этот инструмент может лишь уменьшить количество фальсификаций, но не устранит его полностью: например, в статьях, где не представлены большие объемы числовых данных, закон Бенфорда окажется неэффективным.
Мошенничество в науке сопровождает человечество на протяжении веков, однако для защиты репутации добросовестных ученых и исследований важно дать возможность выявлять недостоверные данные. С помощью базовых статистических методов каждый может оценить достоверность наборов данных и определить, является ли статья качественной научной работой или, скорее всего, поддельной.