Морфология. Патология
УДК 616
© 2011 Н.А. Лысов, П.А. Гелашвили, А.А. Супильников
МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ ОБЪЕКТИВИЗАЦИИ МОРФОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ
Представлен анализ литературы о прикладном применении статистических и математических методов в морфологических исследованиях. Методологические основы доказательной медицины в морфологии применялись давно, но необходимо внедрение этих принципов в единую систему построения научного морфологического исследования.
«Но раз уже мы наблюдаем проникновение в сравнительную анатомию строгих и точных методов, то открывается и перспектива возможности управления явлениями. Ренессанс наук, подобных сравнительной анатомии, которые некоторыми чрезмерными почитателями всякого «эксперимента» презрительно называются «описательными», может быть будет не менее плодотворным, чем внедрение в биологию физики и химии. Но оба направления будут, конечно, широко использовать математику, царицу и служанку всех наук».
А.А.Любищев
[Любишев А.А. О количественной оценке сходства. - Применение математических методов в биологии.
С позиции основных методологических подходов организм рассматривается как динамическая система, находящаяся в состоянии неустойчивого гомеостатического равновесия (12, 104, 105). Под системой, в медико-биологических исследованиях понимается комплекс морфометрических, биохимических, иммунологических и различных других показателей структурных элементов, объединенных процессом функционирования, которого нет у составляющих его элементов.
Накопление и описание фактов с помощью наблюдения или специально поставленного эксперимента - наиболее распространенный в медицине способ познания. Однако без превращения в систему этот набор фактов не всегда можно целесообразно использовать. С развитием наук растет роль анализа фактов и их превращения в теоретические представления. Известно, что математика является наиболее совершенным инструментом этого периода познания явлений, так как дает возможность упорядочить получаемую информацию, оценить достоверность полученных выводов и закономерностей, чего иногда трудно достичь одними логическими умозаключениями.
Методы математической статистики хорошо развиты и широко распространены, они стали традиционными в современной медицине. В то же время, формальные методы анализа
вопросов, касающихся отдельны больных, принятия решения врачом, в настоящее время развиты меньше и, во всяком случае, не распространены так широко (30).
Биологический морфогенез можно рассматривать как процесс самоорганизации - процесс, в ходе которого глобальный паттерн системы порождается многочисленными локальными взаимодействиями элементов низших уровней, причем биологическая самоорганизация направляется и закрепляется естественным отбором (51, 79, 80, 83, 94, 96, 101).
Взгляд на живые системы как на самоорганизующиеся сети, все компоненты которых взаимосвязаны и взаимозависимы, в процессе развития истории философии и науки неоднократно высказывался в той или иной форме. Однако модели самоорганизующихся систем предложены лишь недавно, когда стал доступен новый математический инструментарий, позволивший ученым смоделировать нелинейные характеристики взаимосвязанности сетей. Открытие этой новой математики сложности все чаще признается учеными одним из важнейших событий XX века (49).
Во всех сложных системах присутствуют свойства, которые могут быть описаны с помощью нелинейных моделей. С особенной готовностью представление о нелинейном мире восприняла биология. Слишком очевидной является индивидуальность и разнообразие живых систем.
В зарубежных медико-биологических исследованиях все более популярными становятся непараметрические методы, мощность которых незначительно уступает параметрическим.
Ряд авторов вообще считает, что в медико-биологических исследованиях, особенно если речь идет о малых выборках, должны использоваться только непараметрические методы.
Медицинская информация представляет собой данные в большой степени описательного характера, формализмов, подверженных крайней вариабельности, а числовые данные, также в большинстве случаев, не могут быть хорошо упорядоченными и классифицируемыми, так как изменяются в зависимости от клинических традиций различных медико-биологических школ, геосоциальных особенностей регионов и т. д. (77, 99).
Стентон Гланц в предисловии к книге "Медико-биологическая статистика" пишет: "Результаты многих биологических и медицинских работ основаны на неправильном использовании статистических методов и способны только ввести в заблуждение. Большинство ошибок связано с неправомерным использованием критерия Стьюдента" (31- стр.4.)
Во-первых, необходимым условием использование любого параметрического метода (основанного на сравнении параметров выборок), к которым относится 1-тест, является нормальный характер распределения.
Вторым условием использования 1-теста, является равенство дисперсий в выборках, то есть в них должен быть сопоставимый разброс данных относительно среднего.
Наконец, третьей весьма распространенной ошибкой в применении 1-теста является его использование для попарного сравнения трех и более групп, тогда как он предназначен лишь для сравнения двух групп и является частным случаем дисперсионного анализа.
То есть «кульминационная» и, как правило, единственная оставшаяся от всей статистической обработки фраза "р<0,05" - не будет отражать ничего реального (75).
Сложность морфологического строения организмов, органов, клеток, процессов морфогенеза и патоморфогенеза, множественность структурной иерархической подчиненности делают системный подход наиболее адекватным методологическим аппаратом для изучения морфологических основ патологических процессов (11, 14).
Системный анализ для медико-биологических наук - научная дисциплин, занимающаяся задачами изучения сложных систем и их управлением в условиях анализа большого количества информации различной природы (7, 46). Все живые системы являются далекими от термодинамического равновесия, открытыми для потоков вещества и энергии системами, имеют сложную неоднородную структуру и иерархическую систему регуляции процессов как внутренней, так и при изменении условий внешней среды. Поэтому математическая формализация представлений о процессах в живых системах представляет значительные трудности.
В конце двадцатого века в медицинской науке и клинической практике была сформулирована и стала утверждаться новая методологическая концепция сбора, анализа и оценки научной информации для принятия решений относительно конкретных клинических задач. Эта концепция получила название доказательной медицины - еvidence based medicine (англ.) (86, 103).
Развитию количественных подходов к изучению нормальной и патологической морфологии человека и животных во многом способствовало использование принципов биометрии и морфометрии (1-7,19, 34, 48, 69, 73, 95).
Основной задачей количественной морфологии считается разработка системы основных теоретических понятий такого диапазона, чтобы любые частные явления можно было объяснить дедуктивным путем как логическое следствие небольшого числа основных принципов и понятий (7).
Однако современный этап развития морфологии человека нуждается в широком применении морфометрических подходов, разработке новых математических методов анализа, адекватно отражающих характер развития патологических процессов.
В современной науке математическое моделирование играет особую роль. Математические модели - это язык, на котором формулируются наши представления о явлениях в живой и неживой природе. В докомпьютерную эру математическая модель, чтобы стать полезной для изучения реального объекта, должна была иметь аналитическое решение. Это, конечно, сильно ограничивало возможности математического моделирования, по сути дела, сводило круг моделей к системам линейных уравнений и очень небольшому набору нелинейных систем первого и второго порядка.
Попытки математического моделирования биологических структур и процессов, наряду с поиском натурных и экспериментальных моделей для описания и исследования биологического морфогенеза, давно предпринимаются биологами (44, 45, 47, 74).
Проведение морфологических исследований с использованием методов математического моделирования является тем направлением, которое позволяет значительно повысить эффективность выполняемых работ, получить новую ценную информацию, вскрыть и описать закономерности процессов морфогенеза. Как раздел количественной морфологии медицинская морфометрия включает в себя элементы антропометрии, стереометрии, органометрии, гистометрии, кариоцитометрии, ультраструктурометрии, а также микроспектрофотометрии (7, 28, 35).
Большое количество исследователей определили специфику присущую медикобиологическому эксперименту в целом, но существуют и особенности свойственные экспериментальной морфологии, такие как отсутствие возможности во временном плане проведения работы в течение всего эксперимента на одном и том же животном (что снижает точность исследования в 4-6 раз, и требует более строгого подхода к определению этапов исследования на протяжении всего эксперимента и, как следствие этого, увеличения числа исследований и подопытных животных, приводящих к увеличению трудоемкости и удорожанию исследований. Не менее сложные проблемы создаются и в связи с возможностью получения на одном животном (основной объект) большого числа измерений одного и того же признака (показателя), требующие учитывать и при планировании эксперимента как число животных, так и число измерений. Имеет значение и влияние зависимости функциональных показателей от многих морфологических параметров, затрудняющих как и дискретность наблюдений, подбор дифференциальных уравнений, описывающих тот или иной процесс морфологических преобразований (39, 46, 85).
Существующий язык математики оказался мало приспособленным для описания живых систем будь то отдельная клетка, человеческий организм или общество. Множество исследований, которые формально относятся к приложениям математики в медицине, биологии и т.п., в действительности лишь навеяны обсуждением проблем этих наук. В них иногда ставятся интересные математические задачи, но они, к сожалению, подчас оторваны от той области, в которой были призваны принести пользу (46).
В ходе математического моделирования, позволяющего на заключительном этапе дать практические рекомендации после обоснованного заключения или наметить план дальнейших исследований, потеря значительной части данных, способных оказаться информативными, нежелательно в связи с наличием условий для пропуска данных в условиях медикоморфологического эксперимента и для снижения возможности недоразумений и ряда достаточно печальных клинических ошибок.
О.Ю. Реброва (76) описала подход, являющийся предпочтительным в настоящее время. Он заключается в необходимости анализировать данные два раза - вместе с выпадающими (экстремальными) значениями, а затем без них. После этого необходимо сравнить результаты, и если они устойчивы к выпадающему значению (различаются незначительно), то взять первый результат. Если различаются - привести и прокомментировать и тот, и другой.
Нами показана эффективность применения метода системного многофакторного анализа с учетом удаления эстремальных выбросов (до 5% максимальных и минимальных значений), при наличии достаточного количества наблюдений (58).
Наряду с работой по формализации исходной медицинской информации не менее важной составной частью совместной работы математиков и врачей является структуризация этой информации (30, 46).
В настоящее время нелинейные модели применяются широко. Возможность получать численные решения на компьютерах повлекла за собой развитие многих аналитических подходов. С помощью нелинейных моделей описаны многочисленные процессы пространственно-временной самоорганизации на всех уровнях организации материи - от скоплений галактик до турбулентного течения жидкости, от динамики макромолекул до процессов в биогеоценозах и глобальной динамики.
Особое значение имеют качественные, или базовые, модели, позволяющие описать в наиболее простом математическом виде качественные особенности поведения системы: возможность двух или нескольких стационарных состояний, периодические или хаотические изменения переменных, пространственно неоднородные решения. Базовые модели популяционной динамики легли в основу моделей клеточной биологии, микробиологии, иммунитета, теории эпидемий, математической генетики, теории эволюции и других областей математической биологии (10, 52, 78, 91).
Другим направлением моделирования сложных биологических систем является имитационное моделирование многокомпонентных систем с целью прогнозирования их поведения и поисков оптимального управления. К таким моделям относятся модели кроветворения, модели желудочно-кишечного тракта и других систем жизнеобеспечения организма, модели морфогенеза, также модели продукционного процесса растений, модели водных и сухопутных экосистем (9, 18, 50, 61, 65, 70, 74, 97).
Современное состояние вычислительной техники и программного обеспечения для проведения компьютерного анализа значительно ускоряет и упрощает процесс получения результатов, но кажущаяся «лёгкость» его применения способствует лишь механическому использованию мощных пакетов математического моделирования, которые позволяют не вникать в суть используемых методов. Наиболее часто используются такие мощные математические пакеты как Mathematica, Matlab, MathCad, Gauss, S-Plus. Из статистических пакетов следует назвать и универсальные пакеты: SAS фирмы «SAS Institute», SPSS фирмы «SPSS», Statistica фирмы «Statsoft», Statgraphics фирмы «Manugistics Inc» (8, 15, 17, 68, 76).
Важно обратить внимание на роль прикладного статистического анализа данных, позволяющего правильно описать и обобщить полученные результаты, дать оценку их значимости и достоверности, принять обоснованное решение или осуществить надёжный прогноз исследуемого параметра (13, 37, 38, 41, 42).
Прикладной статистический анализ - понятие, входящее в более расширенную область обработки данных - компьютерный анализ. В последний входят такие разделы как Data Mining (извлечение знаний), технологии искусственного интеллекта и другие методы (31, 42, 76, 81, 82, 88, 89).
Data Mining, включающий такие методы, как искусственные нейронные сети и дискриминантный анализ, позволяют решать задачи, в которых не представляется возможным учесть все реально имеющиеся условия, от которых зависит ответ, в некоторых случаях (искусственные нейронные сети) восстановить пропущенные данные, или выделить приблизительный набор наиболее важных условий решения задачи, но при этом алгоритм нахождения ответа, ранее не был определен (24, 43, 46).
Математическая статистика, анализ решений, распознавание образов и другие, как правило, не снимают проблемы строгого обоснования медицинских результатов, а лишь отодвигают эту проблему в другую область - в обоснование применимости математических методов (30, 32, 33).
Для того чтобы найти новые принципы и методы работы в таких нетрадиционных для применения математики областях знания, как медицина, имеется только один путь - решение конкретных, важных для этих областей задач. Причем они должны рассматриваться во всей реальной сложности, без попыток уложить их в прокрустово ложе заранее готовых математических моделей и методов (16, 25, 31, 54).
В последние годы многие исследователи приходят к твёрдому убеждению, что использование трафаретного подхода к обработке медико-биологических данных методами описательной статистики (дескриптивных моделей), корреляционного и регрессионного анализов не вполне корректно. Эти модели разрабатываются для описания реально протекающего процесса или явления с оценкой только самых общих изменений и тенденций, что влечёт за
собой значительную потерю данных, способных оказаться информативными в решении диагностических задач (60, 65).
Несмотря на огромное разнообразие живых систем, можно выделить некоторые важнейшие присущие им качественные свойства: рост, самоограничение роста, способность к переключениям - существование двух или нескольких стационарных режимах, автоколебательные режимы (биоритмы), пространственная неоднородность, квазистохастичность (91, 93, 94, 98).
При этом, большая часть применяемых в медицине моделей относятся к диагностическим. Диагностические модели, в отличие от физиологических или патогенетических имеют свои особенности. При построении таких моделей одним из основных этапов является определение их параметров. Для этого используются две стратегии эмпирико-статистического анализа данных (41, 66, 67).
Первая стратегия основывается на критерии автоинформативности экспериментальных данных, благодаря которому диагностическую модель можно определить путём аппроксимации геометрической структуры множества объектов в пространстве исходных признаков, не прибегая к сведениям об эмпирических (внешних) отношениях исследуемых объектов, а опираясь только на числовые отношения сходства и различия объектов и признаков. Вторая стратегия определения параметров диагностической модели основана на привлечении и активном использовании обучающей информации о диагностируемом свойстве исследуемых объектов (41, 42).
В огромной части медико-биологических исследований используется первая стратегия. Вторая используется значительно реже, в связи с чем большая часть её методов, которые априори не опираются на вероятностную природу обрабатываемых данных (кластерный, дискриминантный, нейросетевой и др.), остаются за общепринятыми рамками исследования. Прежде всего, этому препятствовало то обстоятельство, что данные, описывающие диагноз или реальный процесс (патологический), как правило, не достаточно обширны и для получения достоверных решающих диагностических правил требуются большие обучающие массивы. По этой причине уместно упомянуть основное требование к описанию заболевания -проводить исследование так, чтобы, не ухудшая возможности решения задач диагностики, создавать классификационную таблицу формализованных признаков (34).
Множество моделей, имитирующих возникновение локализованных стационарных структур в биологическом морфогенезе, приведено в книге Дж. Мерри (100).
Математическое моделирование и статистический анализ в клинической медицине, морфологии, физиологии требует предельно точной постановки исходной задачи и соотнесения её с классами задач и условиями, в которых она является корректной. Следует учитывать, что задачи моделирования состояния патологических процессов и диагностические задачи тесно и взаимно переплетаются (36, 39, 65).
Групповые свойства подразделяются на основные и сопряженные, В морфометрии к основным свойствам относят: 1) средний уровень изучаемого признака, характерный для всей группы в целом; 2) разнообразие (вариабельность) признака - различие исследуемых объектов в группе; 3) распределение признака - количественные соотношения объектов, характеризующихся определенной величиной (структура, типология, профиль процесса); 4) представительность (репрезентативность), типичность выборочных групп, изучение которых дает
достаточно точную характеристику всей генеральной совокупности объектов. Весьма важно знать порог вероятности безошибочного суждения (7, 64).
В статистических исследованиях группировка первичных данных является основным приемом решения задач классификации, а значит и основой всей дальнейшей работы с собранной информацией. Особенностью методов «классического» кластерного анализа, является отличие их от других методов многомерной классификации отсутствием обучающих выборок, т.е. априорной информации о распределении генеральной совокупности (40).
Кластерный анализ способен решить общий вопрос, задаваемый исследователями: как организовать наблюдаемые данные в наглядные структуры, т.е. развернуть таксономию, чтобы содержательно описать различия между отдельными структурами. В ряде классификаций, чем выше уровень агрегации, тем меньше сходства между членами в соответствующем классе (60). Если требуется провести классификацию по нескольким признакам, ранжированным между собой по степени важности, то сначала производится классификация по первому признаку, затем каждый из полученных классов разбивается на подклассы по второму признаку и т.д. Подобным образом строится большинство комбинационных статистических группировок (40, 41, 82).
В тех случаях, когда упорядочить классификационные признаки не представляется возможным, применяется наиболее простой метод многомерной группировки - создание интегрального показателя (индекса), функциональнозависящего от исходных признаков, с последующей классификацией по этому показателю (58).
При проведении кластерного анализа обычно определяют расстояние на множестве объектов, алгоритмы кластерного анализа формулируют в терминах этих расстояний. Мер близости и расстояний между объектами существует великое множество их выбирают в зависимости от цели исследования. В частности, евклидово расстояние лучше использовать для количественных переменных, расстояние хи-квадрат - для исследования частотных таблиц, имеется множество мер для бинарных переменных (40, 42, 60).
Кластерный анализ является описательной процедурой, естественно, он не позволяет сделать никаких статистических выводов, но дает возможность провести своеобразную разведку - изучить «структуру совокупности».
Представитель же другой стратегии - дискриминантный анализ позволяет изучать различия между двумя или более группами объектов по нескольким переменным одновременно (40, 42, 82).
Современное состояние медицины таково, что принятие оптимального решения врачом, научным работником, менеджером здравоохранения, наряду с его профессиональными знаниями, требует умения критически и грамотно оценивать новейшие результаты научных и клинических исследований (21). Поэтому реализация доказательного подхода в клинической практике возможна только при постоянном обучении и самообучении медицинских специалистов современным технологиям поиска, анализа и обобщения медицинской информации (55).
Широкое общественное движение медицинских специалистов, возникшее с целью использовать для лечения больного наиболее обоснованные клинические данные и получившее название «доказательная медицина», все более переходит в плоскость обучения медицинских специалистов приемам и методам доказательности профессиональной деятельности (20, 57, 87).
Каждый тип исследований характеризуется определенными правилами сбора и анализа информации. Если эти правила соблюдены, любой вид исследования можно назвать качественным, независимо от того, будут ли они подтверждать или опровергать выдвинутую гипотезу (31, 60, 72, 76, 81, 89).
В рамках доказательной медицины по определённой проблеме готовится систематический обзор (systematic review, systematic overview) — особый вид научного исследования, выполненный по специально разработанной методике, объектом которого являются результаты других, оригинальных научных исследований. Анализ и обобщение результатов исследований, включенных в обзор, можно проводить с применением статистических методов и без них. Целью систематического обзора является взвешенное и беспристрастное изучение результатов ранее проведенных исследований. Часто в систематическом обзоре проводится количественная оценка суммарного эффекта, установленного на основании результатов всех изученных исследований (метаанализ) (59, 92).
Метаанализ (meta-analysis) - применение статистических методов при создании систематического обзора в целях обобщения результатов, включенных в обзор исследований (90). Качественный метаанализ предполагает изучение всех исследований, посвященных соответствующей проблеме, оценку неоднородности и определение информативности основных результатов путем анализа чувствительности. Преимущества метаанализа: получение достоверных результатов; устранение возможных ошибок; точность оценок; прозрачность.
Сложности: выявление и отбор исследований; неоднородность представленной информации; вероятность потери важной информации; неадекватный анализ сравниваемых подгрупп; неадекватный анализ чувствительности метода Результаты метаанализа обычно представляют в виде графика и отношения шансов (^dds ratio), суммарного показателя, отражающего выраженность эффекта (21).
В настоящее время наблюдается противоречие между теорией методологии доказательной медицины и сравнительно низким уровнем использования ее в практической работе клиницистами. Аналогичный диссонанс существует и в деятельности вузовских научных морфологических лабораторий.
В научно-медицинском сообществе поддерживаются устаревшие представления о методологии исследований, которые отдают приоритет объему выполненных исследований и сложности диагностических методик, а не качеству постановки задач, планированию, обработке материала исследования и качественному представлению результатов исследований с учетом принципов клинической эпидемиологии (23, 84).
Если целью работы является статистическое подтверждение сделанных заранее выводов, то использование приема максимально возможного увеличения объема выборки может привести к тому, что искомые статистические различия будут найдены. Если же исследователь ставит перед собой вопрос о значимых различиях или динамике, а не о различии или динамике вообще, при этом он, как истинный ученый, способен абсолютно одинаково отнестись как к подтверждению, так и к отвержению сформулированной им заранее гипотезы, то ему следует рассчитать объем выборки и привести эти расчеты в своей статье (22, 71, 75).
Первичной проблемой является правильная организация исследования, а вторичной -корректный анализ данных. Однако для получения научно обоснованных, доказательных выводов необходимо отсутствие ошибок на обоих этапах работы.
Предлагаем методический алгоритм статистического исследования и математического моделирования, применяемый в морфологических исследованиях по морфометрическим параметрам (28):
Проверка данных на соответствие нормальному распределению состоит из следующих процедур: а) построение гистограмм с наложенной нормальной (Гаусовой) кривой и нормальных вероятностных графиков; б) расчет асимметрии, ошибки асимметрии и определение их отношения; в) проверка на соответствие нормальному распределению одновыборочным тестом Колмогорова и Смирнова.
Для определения достоверности различий между значениями показателей в группах данных используются непараметрические критерии Манна-Уитни (для двух независимых групп) и Крускала-Уоллиса (для более чем двух независимых групп) с определением статистической значимости этих различий.
Графическая зависимость и ее аналитическое описание представляют собой математическую модель изучаемого вопроса. Адекватность модели проверяется критерием Фишера-Снедекора. Получение модели изучаемого процесса позволяют определить его динамику и характер, подтвердить правильность проведения логических группировок, выяснить весомость отдельных факторов в обеспечении изучаемого процесса. Этот анализ представлял возможность по многочисленным количественным данным вычислить интегральные показатели и сопоставить их с тарировочными.
Таким образом, биологические морфопроцессы детерминируются и регулируются совместным действием многих факторов. Получение и обработка информации о состоянии и свойствах целого организма невозможна без современной математической обработки.
Методологические основы доказательной медицины в морфологии применялись давно, но необходимо внедрение этих принципов в единую систему построения научного морфологического исследования. При таком подходе ссылки на целостность перестанут быть декларативной фразой и получат конкретное и точное научное содержание. Речь не идет о подмене биологических фактов и закономерностей математическим аппаратом, а лишь об использовании последнего как одного из мощных средств познания первых.
К сожалению, развитие морфологии сдерживается разобщенностью научных лабораторий и кафедр, недостатками в оснащении современным оборудованием и препаратами, отсутствием квалифицированных лаборантов. Научный потенциал вузовских работников, особенно в настоящее время, подавляется интенсивной перегрузкой педагогической и учебнометодической работой. Преодоление указанных недостатков позволит резко поднять уровень научных исследований в вузах.
СПИСОК ЛИТЕРАТУРЫ
von Вerta1anffу L. General Systems Theory /Braziller, N.Y., 1968.