کتاب تحلیل سابقه رخداد واقعه با استفاده از نرم‌افزار SAS

در سال‌های اخیر، با توجه به تغییر و تحولات جمعیت در کشور از جمله کاهش نرخ باروري و مسئله سالمندي جمعیت در سال‌هاي آينده، سیاست‌های کلی جمعیت در ۱۴ بند در اردیبهشت ماه سال ۱۳۹۳ توسط رهبر معظم انقلاب اسلامي به همه دستگاه‌ها ابلاغ شد؛ تا براساس آن و با عنایت به اهمیت مقوله جمعیت در اقتدار ملی و پيشرفت کشور، با توجه به پویندگی،  بالندگی و جوانی جمعیت کنونی کشور به عنوان یک فرصت و امتیاز و در جهت جبران کاهش نـرخ رشـد جمعیت و نـرخ بـــاروری در سال‌های گذشته، برنامه‌ریزی جامع برای رشد اقتصادی، اجتماعی و فرهنگی متناسب با اين سیاست‌ها انجام گیرد و اجـرای آنها به طور مستمر رصد شود.
مؤسسه تحقیقات جمعیت کشور، به عنوان تنها مؤسسه ملي، در پاسخ به نیازهای پژوهشي كشور و منطقه در زمينه مسائل و مباحث تخصصي جمعيت  براي انجام تحقيقات جمعيتي در کشور، بيش از دو دهه است که در حوزه‌های ازدواج، خانواده و فرزندآوري؛ جمعيت، سلامت و طول عمر؛ جمعيت، اقتصاد، سرمايه انساني و بازارکار؛ جمعيت، محيط زيست و توسعه ­پايدار؛ مهاجرت داخلي و شهرنشيني؛ روش‌های آماری و مدل­سازي جمعيت در قالب دو پژوهشكده فعاليت مي‌نمايد. اين مؤسسه در راستای مأموریت سازمانی خود، رسالت مهمی را در تحليل مسائل جمعیتی و تدوین سیاست­ها و برنامه‌ها در اين حوزه به عهده دارد.

از آنجا که یکی از فعالیت‌های مؤسسه انتشار گزارش‌ها و کتاب‌های تخصصی در حوزه‌های مختلف جمعیتی در راستاي مأموريت مؤسسه و آخرين بند سياست‌هاي ابلاغي «رصد مستمر سیاست‌های جمعیتی در ابعاد کمی و کیفی با ایجاد ساز و کار مناسب و تدوین شاخص‌های بومی توسعه انسانی و انجام پژوهش‌های جمعیتی و توسعه انسانی» مي‌باشد؛ کتاب تحليل سابقه رخداد واقعه با استفاده از نرم‌افزار SAS که به تحليل داده‌هاي جمعيتي با روش‌هاي پيشرفته آماري مي‌پردازد، توسط دو نفر از دانشياران مؤسسه خانم‌ها دکتر آرزو باقري و دکتر مهسا سعادتي تأليف شده است. این کتاب مهم و ارزشمند، حاصل چندین سال مطالعه و انجام طرح‌هاي پژوهشي مشترک نویسندگان است. تلاش و زحمات ارزشمند ایشان در تألیف کتاب شایسته تقدیر و سپاس مي‌باشد. همچنین لازم است از ارزیابی، نظارت و دقت نظر دو نفر از اساتید برجسته آمار کشور، جناب آقای دکتر مجتبي گنجعلي و دکتر محمد اصغري جعفرآ بادي در به ثمر رسیدن این کتاب تقدیر و تشکر گردد. امید است این کتاب منبع مهم و ارزشمندی برای پژوهشگران و سیاست‌گذاران علاقمند به حوزه جمعیت باشد.

جهت سفارش کتاب، با “مسئول کتابخانه و انتشارات”موسسه به شماره داخلی ۱۰۵ تماس حاصل فرمائید.

درباره کتاب:

در بسیاری از مطالعات علوم اجتماعی و پزشکی هدف، بررسی تغییرات جمعیتی در طول زمان می‌باشد که توصیف آنها برحسب تغییرات زندگی افراد را تاریخچه زندگی[۱] می‌نامند و به منظور بررسی این تاریخچه، اغلب از تحلیل سابقه رخداد واقعه[۲] استفاده می‌شود (ویلکنز[۳]، ۲۰۱۴). در تحلیل سابقه رخداد واقعه، سؤالات بسیاری درباره رخداد وقایع[۴] (پیشامدها يا حوادث) در دوره زمانی خاصی از زندگی افراد از جمله تولد و مرگ، اتمام دوره تحصیلی، ازدواج، پیشرفت شغلی، تولد فرزند، طلاق، ترک تحصیل، از دست دادن شغل و مصرف مواد مخدر مطرح می‌گردند. در این تحلیل‌ها اغلب، زمان تا رخداد واقعه[۵] و نوع وقایع[۶] برآمدهای[۷] مورد نظر پژوهشگر می‌باشند (اندرسن و کیدینگ[۸]، ۲۰۰۲) و تبیین دلایل بزرگتر بودن مخاطره رخداد واقعه مورد مطالعه برای برخی افراد در مقایسه با سایرین، از اهداف اصلی پژوهش است (ورمونت و مورس[۹]، ۲۰۰۵).
در این مطالعات، روش‌های متداول برای تحلیل رخداد واقعه، بدون توجه به زمان وقوع آن، روش‌های مدل‌سازي مانند رگرسیون لوژستيک هستند که به پژوهشگران امکان بررسی ارتباط میان احتمال رخداد واقعه با متغیرهای کمکي[۱۰] مورد نظر را فراهم می‌نمایند. با این‌حال این روش‌ها، اطلاعات موجود در زمان تا رخداد واقعه را نادیده گرفته و تنها احتمال رخداد آن‌ را بررسی می‌کنند و نمی‌توانند به این سؤال که واقعه مورد نظر تا چه زمانی رخ می‌دهد، پاسخ دهند.
روش آماری صحیح به منظور تحلیل این داده‌ها، روش‌های تحلیل سابقه رخداد واقعه می‌باشند (کیلی و مارتین[۱۱]، ۲۰۰۵). از آن‌جا که این روش، نخستین بار برای تحلیل رخداد مرگ توسط آمارشناسان مورد استفاده قرار گرفت، امروزه با نام‌های دیگری نظیر تحلیل بقا[۱۲]، تحلیل زمان شکست[۱۳]، تحلیل خطر[۱۴]، تحلیل گذار[۱۵] و تحلیل طول مدت[۱۶] نیز به‌کار می‌رود (کلین‌بام و کلین[۱۷]، ۲۰۰۸). از تحلیل بقا در مطالعات پزشکی برای مدل‌سازي زمان رخداد وقایع منفی مانند زمان مرگ یا عود بیماری[۱۸] و وقايع مثبت مانند زمان بهبود بعد از عمل جراحي که هدف آن‌ها تأکید بر طول بقای افراد بعد از ابتلا به بیماری‌های خاص می‌باشد، استفاده می‌شود (هسمر و لمشو[۱۹]، ۲۰۰۹؛ کلت[۲۰]، ۲۰۰۳). در مطالعات علوم اجتماعی نیز به منظور بررسی وقایع مثبت مانند تولد، اتمام دوره تحصیلی، ازدواج، تولد فرزند، پیشرفت شغلی و بازگشت به کار پس از اخراج و همچنین وقایع منفی مانند مرگ، طلاق، اخراج از شغل و ترک تحصیل از تحلیل بقا با عنوان تحلیل سابقه رخداد واقعه استفاده می‌گردد (باکس- استفنسمیر و دبوئف[۲۱]، ۲۰۰۶).
تحليل سابقه رخداد واقعه، مجموعه‌اي از روش‌هاي آماري براي تحليل داده‌هايي است كه متغير پاسخ آن‌ها زمان تا رخداد واقعه مي‌باشد؛ روش‌های ناپارامتری[۲۲]، نیمه‌پارامتری[۲۳] و پارامتری[۲۴] از پرکاربردترین روش‌ها به منظور تحلیل سابقه رخداد وقایعی نظیر فرزندآوری، ازدواج و مرگ هستند که در سال‌های اخیر توسط پژوهشگران در حوزه‌های مختلف علوم اجتماعی و پزشکی مورد استفاده قرار گرفته‌اند (رازقی و همکاران، ۱۳۹۳؛ خدیوزاده و همکاران ۱۳۹۳؛ سعادتی و باقری، ۱۳۹۴، a۱۳۹۶ و ۲۰۱۸؛ رحيمي فروشاني و همکاران، ۱۳۹۵؛ باقری و سعادتی، ۱۳۹۶؛ سعادتی و همکاران، ۱۳۹۶ و ۲۰۱۸). روش‌های ناپارامتری تحلیل سابقه رخداد واقعه مانند برآوردهای کاپلان- میر[۲۵] و آزمون رتبه- لگاریتمی[۲۶] با این‌که به توصیف اطلاعات موجود در داده‌ها می‌پردازند، اما قادر به بررسی تأثیر همزمان متغیرهای پیش‌بین بر روی متغیر پاسخ نیستند. مدل مخاطرات متناسب کاکس[۲۷]، روشی‌ نیمه پارامتری برای مدل‌سازي داده‌های سابقه رخداد واقعه است که به دلیل عدم نیاز به تعیین توزیع تابع خطر و امتیاز تولید و تفسیر ساده نسبت‌های خطر با حداقل پیش‌فرض‌ها، در عمل کاربرد فراوانی دارد (کلت[۲۸]، ۲۰۰۳). با این وجود مدل مخاطرات متناسب کاکس نیازمند برقراری پیش‌فرض مخاطرات متناسب است که بدون برقراری آن، تفسیر نتایج گمراه‌کننده و تحلیل‌ها نامعتبر خواهند بود. مدل کاکس طبقه‌بندی شده[۲۹] یکی از روش‌هایی است که در صورت عدم برقراری پیش‌فرض مخاطرات متناسب، استفاده می‌شود؛ با این حال در این روش، امکان بررسی متغیری که طبقه‌بندی براساس آن انجام شده از بین می‌رود. از سوی دیگر مطالعات مختلف نشان داده‌اند که اگر پیش‌فرض‌های یک توزیع احتمال برای داده‌ها برقرار باشد، استفاده از روش‌های پارامتری استنباط‌های دقیقتری به دنبال خواهند داشت. مدل‌های زمان شکست شتابیده[۳۰] (AFT) یکی از انواع مدل‌های پارامتری هستند که در صورت عدم برقراری پیش‌فرض مخاطرات متناسب، می‌توانند جایگزین مناسبی برای این مدل‌ها باشند. در مطالعات مختلف نشان داده شده است که حتی در صورت برقراری پیش‌فرض مخاطرات متناسب، مدل‌های پارامتری برآوردهای ضرایب کاراتری تولید می‌کنند (سعادتی و باقری، ۱۳۹۴؛ سعادتی و باقری، ۱۳۹۶).
در برخی از مطالعات، تحلیل زمان‌های رخداد چندین واقعه به صورت همزمان مانند زمان‌های فرزندآوری اول، دوم، سوم و غیره مورد نظر است؛ این وقایع که بیش از یکبار و به صورت ترتیبی برای هر فرد رخ می‌دهند را وقایع بازگشتی[۳۱] می‌نامند. این داده‌ها به دلیل این‌که در طول زمان جمع‌آوری می‌شوند و بین وقایع آن‌ها وابستگی وجود دارد، دارای ویژگی‌های خاص و ساختار آماري متفاوتی نسبت به زمان­هاي بقاي تک متغیره هستند. در تحلیل این داده‌ها استفاده از مدل‌های متداول (نیمه‌پارامتری و پارامتری) با توجه به این‌که پیش‌فرض اصلی آن‌ها استقلال داده­ها است، منجر به برآورد ناصحیح واریانس و در نتیجه استنباط‌های غلط می­گردد. در این حالت، به کارگیری روش‌های صحیح برای تحلیل این نوع داده‌ها ضروری می‌نماید (آمریم[۳۲] و همکاران ۲۰۰۸)؛ در این شرایط باید از مدل‌های وقایع بازگشتی بقا شامل مدل‌های تصحیح واریانس[۳۳] (مدل‌های اندرسون- گیل[۳۴] (AG)، پرنتیس- ویلیامز- پترسون (PWP)[۳۵] و وی- لین- ویسفلد[۳۶] (WLW)) و همچنین مدل‌های شکنندگی[۳۷] (شکنندگی مشترک[۳۸]، همبسته[۳۹] و وابسته به زمان[۴۰]) استفاده کرد (پاندیا[۴۱] و همکاران، ۲۰۰۵؛ آمریم، ۲۰۱۵). در سال‌های اخیر از این مدل‌ها به منظور مدل‌سازي وقایع مختلف از جمله تولد فرزندان استفاده شده است (سعادتی و باقری، ۱۳۹۵، b۱۳۹۶؛ باقری و سعادتی، ۱۳۹۶، ۲۰۱۸، ۱۳۹۸ و ۲۰۲۱)
با توجه به اهمیت کاربرد روش‌های متداول و پیشرفته تحلیل سابقه رخداد واقعه در علوم اجتماعی و پزشکی، این کتاب به تفصیل به معرفی این روش‌ها می‌پردازد؛ به علاوه از آنجا  ‌که یکی از دلایل عدم به کارگیری این روش‌ها توسط پژوهشگران در مطالعات مختلف، آشنا نبودن آنها با نرم‌افزارهایی است که به صورت کاربردی این مدل‌ها را روی داده‌ها برازش می‌دهند یکی از مهمترین اهداف این کتاب علاوه بر معرفی روش‌های تحلیل سابقه رخداد واقعه، نحوه برازش این مدل‌ها با استفاده از نرم‌افزار SAS براساس داده‌های فواصل موالید و تفسیر نتایج آن می‌باشد؛ بدین منظور در این کتاب، در هر دو فصل متوالی به ترتیب مبانی نظری و روش‌های تحلیل سابقه رخداد واقعه معرفی و سپس نحوه برازش و کاربرد این روش‌ها، براساس مجموعه داده فواصل موالید با استفاده از نرم‌افزار SAS به صورت زیر ارائه شده‌اند؛
در فصل اول، مبانی تحلیل سابقه رخداد واقعه شامل تعاریف و مفاهیم واقعه، زمان رخداد واقعه، داده‌های سانسورشده[۴۲] و پیش‌بین‌های وابسته به زمان[۴۳] و همچنین مبانی نظری مربوط به توابع بقا و خطر ارائه می‌گردند.
در فصل دوم به معرفی داده‌های فواصل موالید و نرم‌افزار SAS، نحوه تبدیل (ورود و خروج) داده‌ها و ایجاد جداول فراوانی در این نرم‌افزار پرداخته می‌شود.
در فصل سوم روش‌های ناپارامتری تحلیل سابقه رخداد واقعه شامل برآورد‌های کاپلان- میر، جدول عمر[۴۴] و نلسون- آلن[۴۵] تابع بقا[۴۶]، خطای استاندارد، بازه[۴۷] و نوار اطمینان[۴۸] برآورد تابع بقا، برآوردهای کاپلان- میر و جدول عمر تابع خطر[۴۹]، برآورد تابع خطر تجمعی و همچنین مقایسه توابع بقا در دو و سه گروه و بیشتر با استفاده از آزمون‌های رتبه- لگاریتمی، ویلکاکسون، تارون- ویر[۵۰]، پتو-پتو[۵۱]، پتو-پتو تعدیل شده[۵۲] و فلمینگ- هرینگتون[۵۳] پرداخته خواهد شد.
در فصل چهارم  به کاربرد روش‌های ناپارامتری تحلیل سابقه رخداد واقعه که در فصل سوم به آنها اشاره شده در تحلیل مجموعه داده فواصل موالید با استفاده از LIFETEST PROC پرداخته می‌شود؛ در این فصل کلیه برنامه‌ها به صورت کامل تشریح و خروجی‌های بدست آمده به تفصیل تفسیر می‌شوند.
در فصل پنجم مدل‌های نیمه‌پارامتری تحلیل سابقه رخداد واقعه، شامل مدل‌سازي تابع خطر، مدل مخاطرات متناسب کاکس، نحوه برازش مدل مخاطرات متناسب کاکس، روش‌های انتخاب مدل، تفسیر برآورد پارامترها، ارزیابی اعتبار مدل مخاطرات متناسب کاکس با استفاده از مانده‌‌ها[۵۴]، روش‌های ارزیابی پیش‌فرض مخاطرات متناسب  و مدل کاکس طبقه‌بندی شده معرفی می‌گردند.
در فصل ششم از PHREG PROC به منظور برازش روش‌های نیمه‌پارامتری تحلیل سابقه رخداد واقعه که در فصل پنجم ارائه شده برای تحلیل مجموعه داده فواصل موالید استفاده می‌گردد. در این فصل کلیه برنامه‌ها به صورت کامل تشریح و خروجی‌های بدست آمده به تفصیل تفسیر می‌شوند.
در فصل هفتم مدل‌های پارامتری تحلیل سابقه رخداد واقعه ارائه خواهند شد؛ در این فصل ابتدا توابع توزیع بقا و خطر هر یک از مدل‌های پارامتری بقا شامل توزیع‌های نمایی[۵۵]، وایبل[۵۶]، گامپرتز[۵۷]، لگ- لوژستيک[۵۸]، لگ- نرمال[۵۹] و گاما[۶۰] ، سپس مدل‌های مخاطرات متناسب نمایی، وایبل و گامپرتز و مدل‌های زمان شکست شتابیده نمایی، وایبل و لگ-لوژستيک و در انتها مدل‌های شکنندگی بقا معرفی می‌گردند.
در فصل هشتم به کاربرد مدل‌های ‌پارامتری تحلیل سابقه رخداد واقعه که در فصل هفتم به آنها اشاره شده در تحلیل مجموعه داده فواصل موالید با استفاده از LIFEREG PROC و NLMIXED PROC پرداخته می‌شود؛ در این فصل کلیه برنامه‌ها به صورت کامل تشریح و خروجی‌های بدست آمده به تفصیل تفسیر می‌شوند.
در فصل نهم به معرفی مدل‌های وقايع بازگشتي تحلیل سابقه رخداد وقايع شامل مدل‌های تصحیح واریانس بازگشتی AG، PWP و WLW و مدل‌های شکنندگی بازگشتی بقا به همراه برآورد ضرایب و مقایسه این مدل‌ها پرداخته خواهد شد.
در فصل دهم با توجه به اینکه ساختار داده‌ها در مدل‌های بازگشتی بقا با مدل‌های سابقه رخداد واقعه در فصل‌های قبل متفاوت می‌باشد، ابتدا به معرفی انواع ساختار داده در برازش مدل‌های بازگشتی بقا پرداخته می‌شود؛ سپس از مدل‌های وقايع بازگشتي تحلیل سابقه رخداد وقايع که در فصل نهم ارائه گردیده به منظور تحلیل مجموعه داده فواصل موالید با استفاده از PHREG PROC پرداخته می‌شود. در این فصل کلیه برنامه‌ها به صورت کامل تشریح و خروجی‌های بدست آمده به تفصیل تفسیر می‌شوند.

[۱] Life historiy
[۲] Event history analysis
[۳] Willekens
[۴] Events
[۵] Time-to-event
[۶] Type of events
[۷] Outcomes
[۸] Andersen & Keiding
[۹] Vermunt & Moors
[۱۰] Covariates
[۱۱] Keiley & Martin
[۱۲] Survival analysis
[۱۳] Failure time analysis
[۱۴] Hazard analysis
[۱۵] Transition analysis
[۱۶] Duration analysis
[۱۷] Kleinbaum & Klein
[۱۸] Relapse
[۱۹] Hosmer & Lemeshow
[۲۰] Collett
[۲۱] Box-Steffensmeier & DeBoef
[۲۲] Non- parametric
[۲۳] Semi- parametric
[۲۴] Parametric
[۲۵] Kapplan- Meir
[۲۶] Log-Rank
[۲۷] Cox Proportional Hazards
[۲۸] Collett
[۲۹] Stratified Cox regression
[۳۰] Accelerated Failure Time models
[۳۱] Recurrent events
[۳۲] Amorim
[۳۳] Variance corrected models
[۳۴] Anderson-Gill
[۳۵] Prentice-Williams -Peterson
[۳۶] Wei-Lin-Weissfeld
[۳۷] Frailty
[۳۸] Shared
[۳۹] Correlated
[۴۰] Time- dependent
[۴۱] Pandeya
[۴۲] Censored data
[۴۳] Time-dependent covariates
[۴۴] Life table
[۴۵] Nelson-Aalen
[۴۶] Survival function
[۴۷] Confidence interval
[۴۸] Confidence band
[۴۹] Hazard function
[۵۰] Tarone-Ware
[۵۱] Peto-Peto
[۵۲] Modified Peto-Peto
[۵۳] Fleming-Harrington
[۵۴] Residuals
[۵۵] Exponential
[۵۶] Weibull
[۵۷] Log-Logistic
[۵۸] Log-Normal
[۵۹] Gompertz
[۶۰] Gamma

Start typing to see posts you are looking for.