?

Log in

No account? Create an account
Учебник/руководство по регрессионному анализу в SPSS для медиков-биологов? - Добрая фея с топором

> Recent Entries
> Archive
> Friends
> Profile
> My Website

May 23rd, 2012


Previous Entry Share Next Entry
06:34 am - Учебник/руководство по регрессионному анализу в SPSS для медиков-биологов?
Что-то специальное коммьюнити не торопится пропускать мой пост с премодерации. Продублирую у себя, а вдруг?
Посоветуйте, есть ли у вас на примете русский или английский толковый и понятный учебник по статистике, желательно с уклоном для медиков-биологов, а идеально - с понятным руководством к действию именно в SPSS? Мне нужно научиться,
- как в SPSS работать с ROC curves, а именно надо научиться как правильно определить cut-off value для биологического теста учитывая чувствительность и специфичность,
- и как именно работать с регрессией. То есть как получать данные типа "факторы А и В независимо увеличивают риск события С" или "при наличии такого-то антитела А и если тест В положительный, то риск заболевания возрастает в 2 раза", то есть multiple regression, если я понимаю правильно
Базовые знания по статистике есть, но их явно не хватает. Для этой темы читала учебник по статистике для ВУЗов (было все понятно, но это было давно и от этого сейчас не легче), онлайн читала теорию (уровня как в википедии), вроде бы в основном понятно, тыкалась в самоучитель по SPSS, но даже воспроизвести те примеры, что там показывают, у меня не получается.
SPSS есть 13.0 и 17.0.
Спасибо.

(46 comments | Leave a comment)

Comments:


[User Picture]
From:sorhed
Date:May 23rd, 2012 10:39 am (UTC)
(Link)
А тебе как срочно? У меня жена просто отлично владеет SPSS, так что как придёт, спрошу у неё.

Про пункт 2 — это, я так понимаю, bayesian networks.
[User Picture]
From:tanchik
Date:May 23rd, 2012 11:10 am (UTC)
(Link)
Мне нужно было пару лет назад, так что не особо к спеху, ну недели 2, например. :)
Поясню подробней - есть данные, около 80 колонок с разными клиническими и лабораторными параметрами, числовыми и категориальными, а еще типа "да-нет". И где-то 70 наблюдений. Есть сильные значимые корреляции между фактором, который меня интересует, назовем его "Треги" и некоторыми этими параметрами, около десятка, положительные и отрицательные. А часть факторов "да-нет", если их разделить на эти 2 группы, то они достоверно различаются опять же по "Трегам", таких штук пять. То есть я описала статистику, что мол коррелируют, или что мол различаются, а значит возможно что влияют на "Треги". С этим проблем нет. Но от меня хотят большего, а именно - а можно ли предсказать (с такой-то вероятностью) что вот если фактор А увеличен, то "Треги" уменьшатся? Если да, то какой Cut off value для фактора А и как его определила с ROC? А зависимы ли между собой факторы А и В, оба из которых сильно коррелируют с "Трегами", или они влияют на "Треги" независимо друг от друга? А если корреляция между "А" и "Трегами" становится сильней, когда из группы выкидываем всех девочек, это значит что фактор "пол" тоже имеет значение, и как это показать? А какая у вас модель для этих факторов, какие из них важней для "Трегов", а какие не очень?
В общем, на таком уровне мне уже не хватает моего умения просто оценивать нормальность распределения, сравнивать средние и считать корреляции. И на этом вот затык.
[User Picture]
From:sorhed
Date:May 23rd, 2012 11:19 am (UTC)
(Link)
На 70 наблюдениях? Ну, можно что-то сделать, конечно. В общем, ждём. :)
[User Picture]
From:itworks
Date:May 23rd, 2012 10:56 am (UTC)
(Link)
Вот я бы смотрел в сторону applied книг, вроде вот таких:

http://www.amazon.com/Applied-Statistics-Using-STATISTICA-MATLAB/dp/3540719717/ref=sr_1_1?ie=UTF8&qid=1337769887&sr=8-1

там тебе и SPSS, data regression и ROC curves, стоит правда эта книжка огого и непонятно насколько она хороша. Хотел тебе каких-нибудь redbooks по SPSS посоветовать (всеж я в этой конторе работаю) но они все ужасное говно
[User Picture]
From:tanchik
Date:May 23rd, 2012 11:19 am (UTC)
(Link)
Спасибо! Я вечером спрошу Акимку.
[User Picture]
From:jamaica1953
Date:May 23rd, 2012 11:08 am (UTC)
(Link)
http://www.tnu.in.ua/study/downloads.php?do=file&id=3637
Вот, я обычно этим пользуюсь ПФ Рокицкий "Статистика для биологов" Книгу просто скачать
Главная ошибка, с которой сталкивалась на практике. При всех манипуляциях по подсчету среднего, стандартной ошибки, сигмы и тп, есть ограничение, на которое обычно никто не обращает внимания. Распределение исследуемой величины дляжно быть нормальным. То бишь представлять собой симметричную кривую с максимумом. Если это не доказано априоре, сначала надо самолично убедиться.
Пример. Средний возраст населения. Распределение населения какой-либо страны по возрасту обычно не является нормальным (см. половозрастное распределение). Но слова "средний возраст" постоянно встречаются в статотчетах.
Или. Распределение по показателю гемоглобина. Да, мы знаем, что у мужчин и женщин средний показатель гемоглобина разный и уже умеем разделять всех людей на эти группы. Но. Оказывается, что в каждой возрастной группе (скажем, с шагом 10 лет) распределение по показателю гемоглобина людей одного пола тоже несимметричное! А вот этого пока нигде нет - мое собственное открытие...
[User Picture]
From:tanchik
Date:May 23rd, 2012 11:15 am (UTC)
(Link)
Спасибо! Я скачаю. Перед тем как что-то считать, я все факторы прогоняю на тест по нормальности и еще глазами смотрю. То есть потом юзаю только непараметрическую статистику, если распределение не нормальное. Три группы Т-тестом тожене сравниваю. :)
Так что на этом уровне мне кажется я не лажаю. У меня затык на более сложном уровне, вот тут пояснила
http://tanchik.livejournal.com/464893.html?thread=22271229#t22271229
[User Picture]
From:jamaica1953
Date:May 23rd, 2012 11:33 am (UTC)
(Link)
Это уже целая диссертация.
Корреляции ведь не дают понятия о причинно-следственной связи, только о том, что она имеет место среди множества измеряемых параметров. Обычная исследовательская работа - построить гипотезу механизма, то есть выстроить события еще и во времени, тогда можно будет предсказать, что кобыла махнет хвостом, если ее щелкнуть в нос.
Удачи в исследовании механизма!
К сожалению, в медицине сплошь и рядом встречается попытка повлиять на события, не изучив механизм. Это так называемое лечение симптомов.
Например. Лечение гипертонии сосудорасширяющими средствами. Причины повышение кровяного давления - лишний вес (приходится обслуживать бОльшую массу тела), ухудшение эффективности газообмена в легких, сужение сосудов вследствие атеросклероза, нервотрепка (выделение адреналина) и, наверное, еще много других, неизученных. Если расширить сосуды аспирином (народ предпочитает алкоголем), давление, конечно, упадет. Но, поскольку повышенное давление - результат вышеупомянутых причин, то по истечении некоторого времени организм даст отмашку в виде спазма сосудов с неизвестными последствиями.
Вообще нарушать равновесие сложной системы - очень нездоровое занятие. Хорошо, что не успели повернуть сибирские реки вспять
[User Picture]
From:ok_66
Date:May 23rd, 2012 02:40 pm (UTC)
(Link)
Вообще-то среднее, дисперсию и всю прочую фигню вполне можно расчитывать и не для нормальной выборки. Это раз. Вот корреляцию действительно желательно считать для нормальных, но есть методы и для прочих. Это два. Имеются распределения, сводимые к нормальным (логнормальное, к примеру). Это три.
А расчёты я в своё время делал на STATISTICA, на трекере она есть. Там довольно понятные интерфейс и мануал.
[User Picture]
From:tanchik
Date:May 25th, 2012 09:52 am (UTC)
(Link)
Спасибо! Наверное попробую Статистику.
[User Picture]
From:prosto_defka
Date:May 23rd, 2012 11:37 am (UTC)
(Link)
Мне вот этот учебник нравится: http://elibrary.karelia.ru/book.shtml?id=3970
Товарищ читал нам курс статистики, много и толково рассказывал.
[User Picture]
From:torash
Date:May 23rd, 2012 11:42 am (UTC)
(Link)
a help и tutorial в самом SPSS не смотрели?
Мне кажется, они с 13 версии очень хорошии стали. У меня другие задачи и регрессии редки, но я, помнится, много ценного в хелпе и особенно тьюториале вытащила.

Могут быть полезны книги для экономистов - они иногда написаны как для идиотов и очень в этом смысле полезны.
[User Picture]
From:tanchik
Date:May 23rd, 2012 11:47 am (UTC)
(Link)
Смотрела. Воспроизвести не получается - SPSS не нравятся те variables что я ей пытаюсь скормить по образцу из руководства. Никакие не нравятся, что-то я делаю совсем не правильно.
[User Picture]
From:torash
Date:May 23rd, 2012 03:41 pm (UTC)
(Link)
Вы меня раззадорили и я открыла старую базу данных, в которой давно хотела посмотреть логистическую регрессию.
У меня были такие данные - некий профессиональный статус (да-достигнут, нет - не достигнут) и от чего этот статус может зависеть (например, пол (тоже бинарная переменная) и возраст (непрерывная переменная)).
Мне нужно проверить гипотезу насколько достижение статуса предсказывается этими двумя переменными.
Вот мне сильно помогла эта статья http://www.basegroup.ru/library/analysis/regression/logistic/
В SPSS я использовала Binary logistic в меню Regression

На выходе я получила высокоспецифичную и низкочувствительную модель, с красивой и довольно понятной визуализацией ROC кривой. (с ней я пока не разобралась, и оставлю это на завтра).

Параметры отсечения можно задавать под кнопкой options. По умолчанию cut-of стоит 0,5, наверно, есть какие-то правила, по которым этот параметр может меняться.
В-общем, благодаря вам, я теперь играюсь с логистическими регрессиями и пытаюсь продвинуться дальше в своем освоении статистики.

Самой лучшей книгой на русском языке по SPSS является Крыштановский "Анализ социологических данных". Она самая тонкая и при этом самая разумная. Только надо внимательно читать, потому что текст очень плотный.

Если это в тему, то я рада.
[User Picture]
From:tanchik
Date:May 25th, 2012 09:55 am (UTC)
(Link)
Статью по ссылке я читала, спасибо, она хорошая. После нее я сказала что мол, ну теперь все понятно и надо попробовать еще раз. :) И опять ничего не получилось..
Крыштановского гляну, спасибо.
[User Picture]
From:_marmotte
Date:May 23rd, 2012 04:37 pm (UTC)
(Link)
Провериться как variables defined, должны быть numerical. Если у вас они как string определены, то spss их игнорировать в анализе будет.
[User Picture]
From:tanchik
Date:May 25th, 2012 10:00 am (UTC)
(Link)
Спасибо! Все данные у меня там охарактеризованы как количественные и числовые. Не все, но те что я скармливала чтоб попытаться что-то получить. А так есть и порядковые еще и номинальные. Не хочет их есть и ругается, ничего не считает... я что-то делаю сильно не так.
[User Picture]
From:_marmotte
Date:May 25th, 2012 07:01 pm (UTC)
(Link)
А что конкретно говорит, когда ругается?
Если у вас dependent variable continuous, то выбираетe analyze -> regression -> linear. Перетаскиваете треги в dependent variable, фактор A и B перетаскиваете в independent variable (тут надо еще иметь в виду continuous или categorical это факторы).
Если dependent variable is a dichotomy, тогда нужна logistic regression.
Если вас интересует взаимосвязь трегов с фактором А для разных групп, можете для начала split file (data -> split file) и посчитать корреляцию в каждой группе отдельно. А вообще, конечно, нужен moderated regression. Просто забейте в гугле, найдете быстро как делать. А насчет roc и cutoff я не знаю - не биолог.
[User Picture]
From:dok_zlo
Date:May 23rd, 2012 11:48 am (UTC)
(Link)
[User Picture]
From:dok_zlo
Date:May 23rd, 2012 11:50 am (UTC)
(Link)
это если вообще. а конкретно спроси у мужской половины уборщщщщиц. Андрей Николаевич должен или сам знать или знать где смотреть.
[User Picture]
From:tanchik
Date:May 25th, 2012 10:16 am (UTC)
(Link)
Я потыкаюсь еще сама, вдруг я все ж не безнадежна. ;) А потом уже спрошу Профи, что со мной не так. Спасибо.
[User Picture]
From:tanchik
Date:May 25th, 2012 10:15 am (UTC)
(Link)
И кроме Гланца, еще много полезного. :) Спасибо! Пока не скачала, нету времени разбираться, но открыла все.
[User Picture]
From:fea_dreams
Date:May 23rd, 2012 01:48 pm (UTC)
(Link)
У меня есть учебник Наследова по обработке стат.данных в SPSS, он ориентирован больше на социологов и психологов, но все методы рассказаны внятно с пошаговыми инструкциями как это сделать.
[User Picture]
From:tanchik
Date:May 25th, 2012 10:16 am (UTC)
(Link)
А как он называется?
[User Picture]
From:fea_dreams
Date:May 25th, 2012 12:14 pm (UTC)
(Link)
Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных науках.
Есть несколько переизданий, можно брать любое, в более новых версиях используется для примеров более свежие пакеты SPSS.

Edited at 2012-05-25 12:15 pm (UTC)
[User Picture]
From:elentin
Date:May 23rd, 2012 02:33 pm (UTC)
(Link)
Хорошая книжка по статистике - http://antonpiter.narod.ru/7361/5semestr/VM_analiz_dannix.PDF
[User Picture]
From:tanchik
Date:May 25th, 2012 10:18 am (UTC)
(Link)
Спасибо! Скачался файл. Сегодня начну изучать. :)
[User Picture]
From:elentin
Date:May 23rd, 2012 02:34 pm (UTC)
(Link)
Ну да, как обычно, жж посчитал комментарий со ссылкой на сторонний ресурс (см. выше) за спам :-//
[User Picture]
From:whatevergospodi
Date:May 23rd, 2012 04:16 pm (UTC)
(Link)
и мой тоже. там были ссылки на учебник Statistica и Хан академи :(
[User Picture]
From:tanchik
Date:May 24th, 2012 12:53 pm (UTC)
(Link)
Я сказала ЖЖ, что это не спам! Спасибо :)
[User Picture]
From:whatevergospodi
Date:May 23rd, 2012 04:15 pm (UTC)
(Link)
я очень не люблю Спсс, прямо органически не переношу.
в прошлом году мне показали JMP - его можно скачать бесплатно на месяц демо-версию (наверное, если компов больше чем один, можно скачивать несколько раз. Это танк (и стоит он, как танк) - намного удобнее и быстрее, чем все остальное.
Сама я пользуюсь в основном Statistica - и очень рекомендую - их учебник. Он очень неплохой, понятный, в нем легко найти то, что надо (ну, мне так показалось, по крайней мере)
http://www.statsoft.com/textbook/ - попробуй посмотреть его - там вполне биологические примеры в основном приведены.
еще сейчас khan academy (khanacademy.com) - сделали тоже обучающие видео по статистике - мне очень понравились, у них очень правильный подход (они сами смотрят статистику того, как их просматривают люди и на основе этого меняют свои видео) - посмотри, вдруг там будет то, что тебе нужно.
+ когда я готовлюсь к интервью, то смотрю видео на ютюбе - прямо набираешь в поиске - ютюб, спсс и тему (на английском, само собой).
[User Picture]
From:tanchik
Date:May 25th, 2012 10:22 am (UTC)
(Link)
Спасибо, что напомнили про Статистику. У меня она раньше была, а к ней - книжка страниц на 600 как ей пользоваться. :) Потом книжку я продала, уезжая из России, программа куда-то проэтосамилась.. и когда понадобилась статистика снова, оказалось что и СПСС хватает на все. Вернусь поглядеть на статистику все-таки, может с ней будет удачней. Попробую учебник и этот сайт тоже.
[User Picture]
From:drolya
Date:May 23rd, 2012 04:28 pm (UTC)
(Link)
Вот там выше советовали книги для экономистов. Как экономист порекомендую вот что: Damodar N. Gujarati "Basic Econometrics" и его же "Essentials of Econometrics". Они прекрасные.
[User Picture]
From:torash
Date:May 23rd, 2012 06:32 pm (UTC)
(Link)
Точно! И спасибо, что про них напомнили. Давно не в англоязычной среде - забыла про них. Но они прекрасные.
[User Picture]
From:tanchik
Date:May 24th, 2012 12:30 pm (UTC)
(Link)
Спасибо. И там есть именно про ROC кривые, cut-off и как регрессионный анализ делать, да?
[User Picture]
From:tanchik
Date:May 24th, 2012 12:30 pm (UTC)
(Link)
Спасибо. И там есть именно про ROC кривые, cut-off и как регрессионный анализ делать, да?
[User Picture]
From:drolya
Date:May 24th, 2012 07:46 pm (UTC)
(Link)
Я в свое время, уже давно это было, прочла весь учебник "Basic Econometrics". И насколько помню, про ROC кривые там не было. Но. Для тех целей, что у вас описаны, подходит анализ с дамми переменными, которые задают не количественный, а качественный признак. Там это вроде есть. И как строить и проверять регресии там тоже есть. И как бороться с плохими качествами регресий (как то мультиколинеарность, гетероскедостичность и автокорреляция - там вроде тоже есть).

Есть еще учебник Джонстона, но там вроде посложнее, там в матрицах.

Я, помнится, строила регресии в СПСС, но больше мне нравилось регресии конструировать руками и обсчитывать их пакетом анализа в экселе. Мне казалось, что местами лучше СПССа, и четко понятно, что делаешь.
[User Picture]
From:tanchik
Date:May 25th, 2012 10:20 am (UTC)
(Link)
Не первый раз уже получаю комментарий, что в СПСС с регрессиями не очень хорошо (не удобно, криво и тп). Повод задуматься. :) Спасибо.
[User Picture]
From:pascendi
Date:May 23rd, 2012 04:35 pm (UTC)
(Link)
Посоветуйтесь с uborshizzza, один из них (их там двое на аккаунте) преподает в меде как раз медстатистику.
У них в блоге, кстати, выложены фрагменты учебника на эту тему -- толковые.
[User Picture]
From:ristana
Date:May 23rd, 2012 06:40 pm (UTC)
(Link)
+1 училась у него .прекрасный специалист.
[User Picture]
From:tanchik
Date:May 24th, 2012 12:29 pm (UTC)
(Link)
Спасибо!
[User Picture]
From:maksina
Date:May 23rd, 2012 07:11 pm (UTC)
(Link)
Еще актуально? Если да , то озадачу мужа - он SPSS уже много лет преподает, правда не медикам, а социолгам
[User Picture]
From:tanchik
Date:May 24th, 2012 12:28 pm (UTC)
(Link)
А можно показать мужу вот этот текст
http://tanchik.livejournal.com/464893.html?thread=22271229#t22271229
и спросить, куда конкретно мне копать, чтоб на эти вопросы найти решения? Я получила много советов про учебники. Только вот не знаю пока, помогут ли они.
From:(Anonymous)
Date:May 31st, 2012 01:43 pm (UTC)
(Link)
Здравствуйте!

я не по теме поста:). но хотела бы Вас как иммунолога, работающего в штатах спросить, как Вы относитесь к "любви" отечественных врачей назначать процедуру иммунизации лимфоцитами мужа или капельницы с иммуноглобулинами при обнаружении так называемого иммунологического бесплодия или бесплодия неясного генеза.
Просто данной темой занимаются весьма солидные организации центр акушерства им. Кулакова или ЦИР в Москве или даже очень уважаемая профессор Сидельникова, но питерские врачи эту проблему отвергают. Можете ли Вы раскрыть Ваше мнение? Вот здесь мнения против http://forums.rusmedserv.com/showthread.php?t=173962, а есть ли мнения за?
Заранее огромное спасибо.
[User Picture]
From:tanchik
Date:May 31st, 2012 02:12 pm (UTC)
(Link)
Я прочитала топик по ссылке и могу подписаться под каждым выводом Бориса Каменецкого, его обзор очень толковый. К сожалению, отсутствие эффекта и даже неизученный механизм никаким образом не помешают уважаемым врачам из некоторых центров продвигать методику..

> Go to Top
LiveJournal.com