Введение

Идея, лежащая в основе структуры ASpecD: возможные способы воспроизводимой и надежной обработки и анализа данных в спектроскопии.

Воспроизводимый анализ данных

Воспроизводимость сбора и обработки данных лежит в основе правильной науки.

Для достижения этой цели документирование всех параметров (эксперимента) является одним из необходимых условий.

В крупных компаниях, работающих в области химии, фармации и медицины, строгое управление качеством привело к разработке крупномасштабных, коммерческих и высокоинтегрированных систем, требующих максимальных усилий для обеспечения безошибочной записи и документирования каждого этапа обработки.

Однако в фундаментальных исследованиях в академических кругах такие системы в лучшем случае редки, а то и просто не существуют.

В отличие от этого, документирование исследований напрямую коррелирует с мотивацией отдельного ученого справляться с аспектами воспроизводимости, а также с его или ее дисциплиной следовать соответствующим правилам и рабочим процессам.

В действительности, проведенные эксперименты обычно недостаточно документируются, не говоря уже о последующей обработке полученных данных, несмотря на то, что недостающая информация часто может быть получена ретроспективно благодаря опыту и “информированным догадкам” тех, кто непосредственно участвовал в получении данных.

Личная свобода против воспроизводимой науки

В то же время индивидуальность, независимость и личная ответственность ученых подчеркиваются в академическом контексте не без оснований.

В целом, ученые не должны быть ограничены слишком многими и ненужными правилами.

Более того, разработка индивидуальной концепции документирования экспериментальных параметров, необходимых для разумного и адекватного анализа (и воспроизводимости) полученных данных, часто рассматривается как неотъемлемая часть научного образования в университетах.

В частности, в спектроскопии широко распространены самодельные установки и написанное в лаборатории индивидуальное программное обеспечение для получения данных.

Поэтому в данном контексте чрезвычайно важно документировать все экспериментальные параметры, особенно учитывая, что программное обеспечение для сбора данных обычно не заботится об этом самостоятельно.

Поскольку это означает дополнительные усилия для экспериментатора, такая документация должна быть как можно более простой и удобной.

В идеале она должна быть написана в формате, легко обрабатываемом компьютерами, и, таким образом, быть доступной программному обеспечению для обработки и анализа данных.

Ученые не являются инженерами-программистами

Еще один важный аспект: Обычно программы для обработки и анализа данных пишутся отдельным ученым, который в то же время является их основным пользователем.

Однако ученые обычно не знакомы и не знают о ключевых аспектах программной инженерии, разработанных за последние десятилетия.

Эти аспекты – от советов по форматированию и именованию кода до моделей архитектуры приложений – необходимы для создания прочного и надежного программного обеспечения необходимой сложности, которое может быть использовано другими пользователями и достаточно перспективно.

Существуют веские причины, по которым разработка и забота о (более) сложном программном обеспечении обычно находится в компетенции профессиональных инженеров-программистов, которые могут сосредоточиться исключительно на этой задаче.

Однако для большинства исследовательских групп в академическом контексте нанять профессионалов для этой цели не представляется возможным.

Кроме того, отдельные ученые не должны использовать “черные ящики”, о внутреннем устройстве которых они не знают и не понимают.

Одной из стратегий решения этой проблемы может быть ознакомление ученых с проверенными правилами (“лучшими практиками”) программирования, а также с общими концепциями обработки данных, которые были разработаны учеными и доказали свою полезность в повседневной работе.

Это позволит ученым сосредоточиться на своей научной деятельности и будет полезно в долгосрочной перспективе.

Долгосрочное хранение и доступность

Как правило, большинство данных в настоящее время получают и обрабатывают в цифровом виде с помощью компьютеров.

В связи с этим возникают вопросы о долгосрочном хранении и доступности.

В то время как все большее число финансовых агентств в области науки требуют от заявителей предоставления концепций по этим аспектам, разработка соответствующих решений и их реальная реализация в рабочем режиме является далеко не простой задачей.

Учитывая, что зачастую интерес представляют не только необработанные данные, но и детальный анализ, это становится еще сложнее.

Цель: концепции воспроизводимости

Все вышеперечисленные аспекты привели к разработке фреймворка ASpecD (и его предшественников).

Цель фреймворка ASpecD не в том, чтобы решить раз и навсегда все упомянутые проблемы.

Скорее, идея заключается в том, чтобы предоставить концепции и показать пути решения многих отдельных аспектов.

Конечной целью остается создание системы обработки и анализа данных, обеспечивающей полную воспроизводимость (и воспроизводимость, где это возможно), начиная с исходных данных и заканчивая конечными представлениями (рисунки, таблицы).

Различные компоненты и основополагающие принципы системы ASpecD являются результатом более чем десятилетней повседневной практической работы в области экспериментальных наук (в основном спектроскопии) в сочетании с обсуждением требований к соответствующей документации.

Все начиналось с набора отдельных коротких процедур для анализа данных ЭПР с временным разрешением.

В настоящее время разработанные концепции носят гораздо более общий характер и, безусловно, могут быть применены и за пределами спектроскопии.