?

Log in

Вопрос по статистике - то ли кейс-контроль, то ли пре-пост данные? - Добрая фея с топором

> Recent Entries
> Archive
> Friends
> Profile
> My Website

February 27th, 2015


Previous Entry Share Next Entry
12:44 pm - Вопрос по статистике - то ли кейс-контроль, то ли пре-пост данные?
У меня вот такой сабж - каким бы тестом вы считали такие данные (см рисунок)?

Объясняю: на этапе планирования мы предполагали, что у нас 30-40% шанс получить нужный тип клеток из крови пациента после того как он получил пересаженный орган. И у нас 80-90% шанс получить этот тип клеток у пациента до пересадки органа. Мы также знали набор из 5-6 факторов, которые точно влияют на состояние наших клеток (и эти факторы отвечают за variability наших клеток у разных пациентов). И наша задача была получить 2 группы образцов: до пересадки и после пересадки. Наш главный вопрос - меняются ли наши клетки после пересадки органа.
В итоге на этапе до пересадки, когда шансов получить клетки больше, мы сделали "гнезда" - группы пациентов по 3-4 человека, у которых значимые факторы сопоставимы. Получилось даже сопоставить по 9 факторам. То есть "matched" контроли такие, получается. А затем мы пытались выделить клетки у всех, кто получил пересадку органов. И если хотя бы один из "гнезда" давал нам эти клетки, мы получали этот один "case" из группы "после". Около половины "гнезд" пропали впустую - не удалось получить ни одного образца после пересадки. Ни в одном из "гнезд" два образца после пересадки выделить не получилось. Не все пациенты дождались свои органы, не все шло гладко и на этапе до пересадки, часть данных банально потеряли или не собрали и пришлось выключить соответствующие образцы, поэтому на этапе до пересадки в "гнезде" у нас по 3 или 2 образца. Вот такие данные.
И вопрос повторю - чем бы вы считали такие данные? Главный наш вопрос - различаются ли клетки "до" от клеток "после"? Признак количественный, распределение не нормальное, но может быть нормализовано. Если их просто в кучу сложить и сделать тупо Т-тест, не учитывая "гнезда" и не учитывая что это повторные измерения, то будет p value на грани, то есть 0.045. Но хотелось бы сделать правильнее и красивее, и из-за микроскопической величины группы после пересадки (всего 9 образов), и из-за "гнездности", и из-за того что технически это все-таки повторные обследования для одного человека из каждого "гнезда". Если просто взять те самые 9 человек из группы до и после, конечно никакой статистической разницы не будет - слишком мелкая группа со слишком большой дисперсией внутри группы.
Только пожалуйста, не нужно давать советы о том, как надо было проводить эту работу. Она уже сделана, и я не могу в этом изменить ничего, да и не могла особо повлиять и на этапе планирования. Ну то есть я выслушаю совет на будущее для других работ, но на сейчас это будет бесполезно. Нужен совет что сделать с данными. Разумное, чтоб доброе и вечное, а не выкинуть. :)
Спасибо!
Зы: пост про Максика воспоследует. У нас все живы и здоровы, а мне со след недели уже на работу, вот, доделать пытаюсь.

(30 comments | Leave a comment)

Comments:


[User Picture]
From:eleema
Date:February 27th, 2015 05:55 pm (UTC)
(Link)
Мне понятны только "Зы":) Жду след поста.
[User Picture]
From:tanchik
Date:February 28th, 2015 02:04 pm (UTC)
(Link)
Сделаю. :)
[User Picture]
From:botsman
Date:February 27th, 2015 06:59 pm (UTC)
(Link)
Ах молодца мамка, уже на работе (статистику забыл, в бога не уверовал (это к тому что все может быть не так как на самом деле))
[User Picture]
From:tanchik
Date:February 28th, 2015 02:05 pm (UTC)
(Link)
Это потому что няня очень уж дорогая. Нужны деньги чтоб было с кем мелкого оставлять.. :)
[User Picture]
From:botsman
Date:February 28th, 2015 03:08 pm (UTC)
(Link)
Выписать из России, думаю тут даже девки резко подешевели)))
[User Picture]
From:tanchik
Date:February 28th, 2015 04:53 pm (UTC)
(Link)
Мы рассматривали эту возможность :)
Увы, если делать это легально, то получается примерно такая же цена за час, как у няни.
[User Picture]
From:botsman
Date:February 28th, 2015 06:07 pm (UTC)
(Link)
Еще скажите что и торрентами не пользуетесь)))?
[User Picture]
From:tanchik
Date:February 28th, 2015 06:13 pm (UTC)
(Link)
Какие такие торренты? ;)
[User Picture]
From:botsman
Date:February 28th, 2015 06:28 pm (UTC)
(Link)
Вооот, датские знакомые тож сказали, что бояцца и штрафы огого (хз как там у них отслеживают или стучат))
Есть и у нас плюсики (тьфу, иногда они становятся крестиками((
[User Picture]
From:saplady
Date:February 28th, 2015 07:10 pm (UTC)
(Link)
Ещё недавно такие вещи делались через сервера страны У, через него ходили на торренты и лили, а с него уже забирали. Я не делала.
[User Picture]
From:saplady
Date:February 28th, 2015 07:09 pm (UTC)
(Link)
А прививки ей вкалывать и от туберкулёза проверять прямо на въезде и под своим контролем?
[User Picture]
From:botsman
Date:February 28th, 2015 08:12 pm (UTC)
(Link)
а ты кто?
[User Picture]
From:saplady
Date:March 1st, 2015 01:50 pm (UTC)
(Link)
А я человек, который офигевает от тенденции "врачи-убивцы".
[User Picture]
From:botsman
Date:March 1st, 2015 01:59 pm (UTC)
(Link)
ну так и делай это самостоятельно
[User Picture]
From:saplady
Date:March 2nd, 2015 06:48 pm (UTC)
(Link)
А зачем давать такие чудные советы? Среднестатистическая недорогая няня посадит ребёнка за мультики/положит в кровать с соской и будет пиздеть в чатике. А если это из России - привезёт ещё и болячек на себе.
[User Picture]
From:tanchik
Date:March 2nd, 2015 07:28 pm (UTC)
(Link)
Да. Именно это соображение было вторым фактором, из-за которого мы отказались от идеи няни из России-Украины. Хотя хотелось чтоб Максик заговорил все ж на русском сначала.. я ведь на работе буду :((
[User Picture]
From:botsman
Date:March 2nd, 2015 08:32 pm (UTC)
(Link)
блин, я прикололся, тут все по взрослому)))
Уверен Танчик разберется (помня фоты в тот самый момент)
[User Picture]
From:vanxant
Date:February 27th, 2015 09:37 pm (UTC)
(Link)
Сразу оговорюсь, что я не медик и не биолог, но о статистике кое-что слышал и на практике довольно много считал.
В общем главная идея в том, что, имея на руках относительно небольшой набор измерений и гипотезу А, которую хочется доказать (ну или опровергнуть), в большинстве случаев нет никаких проблем придумать, как нужно правдоподобно проредить и/или сгруппировать результаты, чтобы получить искомый доверительный интервал для "надежного" доказательства (опровержения) гипотезы. Поэтому, если вас интересует истина, а не красивый график для статьи, выкидывайте все подобные "прореживания" и "группировки".
С гнездами идея была хороша, но не срослось. Я правильно понимаю, что если бы вы до начала эксперимента не делили пациентов на гнезда у себя в уме, а просто обследовали бы всех "одним гнездом", на ваши реальные действия это никак бы не повлияло? Значит забывайте про гнёзда, не было их у вас.
Дальше вычеркивайте всех, кто не смог сдать обе пробы по орг. причинам (не дожил, организаторы протупили и т.п.). Вас интересует сопоставление "до" и "после", соответственно, везде, где нет "после" - выбрасываем по объективным, не зависящим от вас причинам.
Ну а дальше, 9 пар проб это в большинстве случаев очень мало, если только у вас не совершенно железобетонный закон. Имо исследуйте дальше...
[User Picture]
From:tanchik
Date:February 28th, 2015 02:09 pm (UTC)
(Link)
Да, спасибо, этот тот самый случай очень правильного и бесполезного совета..
Одна попытка выделения клеток это 10 часов моей единоличной работы руками, не самой простой к тому же. И чаще всего это 10 часов в будни + работа на выходных, в субботу или воскресенье. Представьте теперь себе, как я отношусь к совету выкинуть полученные данные потому что пи не натягивается...
Исследовать дальше тоже уже нельзя, как я и написала
[User Picture]
From:strelok_radist
Date:February 27th, 2015 10:19 pm (UTC)
(Link)
* и эти факторы отвечают за variability наших клеток у разных пациентов *

Доходчиво объяснила. :)))
[User Picture]
From:tanchik
Date:February 28th, 2015 02:10 pm (UTC)
(Link)
Отвечают за вариабельность? за разнообразность? за дисперсию данных? Мучалась-мучалась, и решила нафиг, кому надо тот поймет и по английски. :)
[User Picture]
From:strelok_radist
Date:February 28th, 2015 02:44 pm (UTC)
(Link)
Мы дома с женой тоже на русско-английской мове общаемся, так что я тебя понимаю :)
[User Picture]
From:yenissey
Date:February 27th, 2015 10:44 pm (UTC)
(Link)
sign rank for matched pairs для тех 9, что с обеими точками
если не дает стат.значимости - ну значит не судьба
если картинка несмотря на это красивая - можно попытаться продать ее как картинку, не упирая на р
в общем случае, у вас палюбому с одной стороны только 9 точек
и выбор чего-либо кроме само-контролей для этих точек будет трудно обосновать
кстати, если у вас запротоколированное исследование, то там все планируемые тесты должны быть уже написаны, и у тебя выбора быть не должно
ревьюеры уже нередко требуют придерживаться только исходных гипотез, особенно когда видят попытку "повыжимать ворону" еще немножко
[User Picture]
From:tanchik
Date:February 28th, 2015 04:25 pm (UTC)
(Link)
Wilcoxon конечно не дал значимости, откуда ей если 9 точек всего.
На тему протокола - это конечно же не клин трайл и никто никого не лечит, иначе никто бы и не играл со статистикой. Это попытка получить предварительные данные для отдельного проекта (или не получить их).
[User Picture]
From:ymi_an_island
Date:February 27th, 2015 10:44 pm (UTC)
(Link)
я наверное не вполне понял задачу - но кажется, что это случай для непараметрической ANOVA? 2-way Friedman test типа. Я не уверен, насколько он хорошо работает с несбалансированными данными (в каждом гнезде 1 case, но 2-3 контроля).http://en.wikipedia.org/wiki/Friedman_test
[User Picture]
From:ymi_an_island
Date:February 27th, 2015 10:46 pm (UTC)
(Link)
но должет сразу огорчить (или обрадовать), что если все слить вместе и сделать t-test и получается p=0.045, то что угодно непараметрическое даст большее значение p.
[User Picture]
From:tanchik
Date:February 28th, 2015 04:26 pm (UTC)
(Link)
Спасибо. Поковыряла, говорят нет - он не может чтоб с одной стороны было три или 2 значения, а с другой одно. :((
[User Picture]
From:ymi_an_island
Date:February 28th, 2015 09:29 pm (UTC)
(Link)
я вот тоже этого опасался, хотя обычно непараметрика довольно хорошо переносит несбалансированность.
Ну хорошо, а если попробовать вот такой resampling: из каждого гнезда берется case и 1 случайно выбранный контроль; они образуют пару и к ним применяется paired t-test. Paired t-test имеет большую мощность, может показать достоверность там, где unpaired или ANOVA не могут. И это делается 100 раз и смотрится на распределение полученных p-values.
[User Picture]
From:Мария Аксенова
Date:February 28th, 2015 05:09 pm (UTC)
(Link)
В данном случае следует применить дисперсионную статистику для последовательных наблюдений, например GLM или иную, которую поддерживает имеющаяся в наличии статистическая программа. Статистика для несвязанных переменных в данном случае использоваться не должна, поскольку сравнение производится с состоянием "до" у тех же пациентов. Сначала производится сравнение без дополнительных факторов и ковариат. Затем в расчет вводятся те факторы и ковариаты, которые могут повлиять на исход. GLM работает и на относительно небольших выборках, но нужно перед расчетом проверить сферичность (есть такая опция в большинстве программ) сферичность должна быть. В результате первого подсчета получится ответ о достоверном изменении показателя во времени. Второй подсчет покажет влияние факторов и ковариат на изменение. Если наблюдений мало и подсчет не работает - тогда только описательная статистика и планирование следующего эксперимента на ее основе (это если сравнительная статистика остро необходима).
[User Picture]
From:5cr34m
Date:March 1st, 2015 08:12 am (UTC)
(Link)
краскел-уоллес?

> Go to Top
LiveJournal.com