Математическая биология и биоинформатика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Матем. биология и биоинформ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Математическая биология и биоинформатика, 2022, том 17, выпуск 2, страницы 230–249
DOI: https://doi.org/10.17537/2022.17.230
(Mi mbb487)
 

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Информационные и вычислительные технологии в биологии и медицине

Применение закона Бенфорда для оценки качества данных профилактического скрининга

О. А. Старунова, С. Г. Руднев, А. Е. Иванова, В. Г. Семёнова, В. И. Стародубов

Центральный научно-исследовательский институт организации и информатизации здравоохранения, Москва, Россия
Список литературы:
Аннотация: Эмпирический закон Бенфорда, описывающий вероятность появления определённых первых значащих цифр во многих распределениях, взятых из реальной жизни, используется для выявления аномалий в различного рода данных. Целью исследования является апробация закона Бенфорда для анализа качества массовых данных профилактического скрининга на примере данных биоимпедансных измерений в центрах здоровья Москвы. Как было установлено ранее, особенностью таких данных является их сильное зашумление искусственно сгенерированными и поддельными данными. Сформированная база данных биоимпедансометрии центров здоровья Москвы за 2010–2019 гг. содержала 1361019 записей результатов измерений в возрастном диапазоне обследованных от 5 до 96 лет. Применение алгоритма экспертной оценки качества данных, использованного в качестве эталона для анализа эффективности Бенфорд-анализа, выявило высокий процент некорректных данных (66.5%) с преобладанием сфальсифицированных данных. Для характеристики степени соответствия данных закону Бенфорда для каждого центра здоровья рассчитывали средние абсолютные отклонения частот встречаемости первой и первых двух значащих цифр от должных значений и статистики $\chi^2$ для десятых степеней стандартизованных значений активного, реактивного сопротивлений импеданса и индекса активного сопротивления. Установлена значимая корреляция между отклонением данных от закона Бенфорда и процентом некорректных данных согласно алгоритму экспертной оценки качества ($\rho_{\mathrm{max}}$ = 0.66 и 0.62 для среднего абсолютного отклонения и величины $\chi^2$, соответственно, на основе параметра активного сопротивления импеданса и первой значащей цифры). Получено, что отклонение данных от закона Бенфорда является достаточным условием их компрометированности. Для центров здоровья, где основную часть некорректных данных составляли многократные измерения одного человека под видом разных, данные хорошо соответствовали закону Бенфорда. Если же в структуре некорректных данных преобладали измерения калибровочного блока, программные эмуляты измерений и выбросы, то использование закона Бенфорда позволяло эффективно ранжировать центры здоровья по уровню компрометированности данных.
Ключевые слова: центры здоровья, профилактический скрининг, большие данные, биоимпедансометрия, качество данных, алгоритм экспертной оценки качества, закон Бенфорда.
Финансовая поддержка Номер гранта
Российский научный фонд 20-15-00386
Работа выполнена в ФГБУ “ЦНИИОИЗ” Минздрава России при поддержке Российского научного фонда (грант № 20-15-00386, рук. В.И. Стародубов).
Материал поступил в редакцию 31.10.2021, 19.10.2022, опубликован 05.11.2022
Реферативные базы данных:
Тип публикации: Статья
Образец цитирования: О. А. Старунова, С. Г. Руднев, А. Е. Иванова, В. Г. Семёнова, В. И. Стародубов, “Применение закона Бенфорда для оценки качества данных профилактического скрининга”, Матем. биология и биоинформ., 17:2 (2022), 230–249
Цитирование в формате AMSBIB
\RBibitem{StaRudIva22}
\by О.~А.~Старунова, С.~Г.~Руднев, А.~Е.~Иванова, В.~Г.~Семёнова, В.~И.~Стародубов
\paper Применение закона Бенфорда для оценки качества данных профилактического скрининга
\jour Матем. биология и биоинформ.
\yr 2022
\vol 17
\issue 2
\pages 230--249
\mathnet{http://mi.mathnet.ru/mbb487}
\crossref{https://doi.org/10.17537/2022.17.230}
\elib{https://elibrary.ru/item.asp?id=50158431}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/mbb487
  • https://www.mathnet.ru/rus/mbb/v17/i2/p230
  • Эта публикация цитируется в следующих 1 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2024