در سالهای اخیر، با توجه به تغییر و تحولات جمعیت در کشور از جمله کاهش نرخ باروري و مسئله سالمندي جمعیت در سالهاي آينده، سیاستهای کلی جمعیت در ۱۴ بند در اردیبهشت ماه سال ۱۳۹۳ توسط رهبر معظم انقلاب اسلامي به همه دستگاهها ابلاغ شد؛ تا براساس آن و با عنایت به اهمیت مقوله جمعیت در اقتدار ملی و پيشرفت کشور، با توجه به پویندگی، بالندگی و جوانی جمعیت کنونی کشور به عنوان یک فرصت و امتیاز و در جهت جبران کاهش نـرخ رشـد جمعیت و نـرخ بـــاروری در سالهای گذشته، برنامهریزی جامع برای رشد اقتصادی، اجتماعی و فرهنگی متناسب با اين سیاستها انجام گیرد و اجـرای آنها به طور مستمر رصد شود.
مؤسسه تحقیقات جمعیت کشور، به عنوان تنها مؤسسه ملي، در پاسخ به نیازهای پژوهشي كشور و منطقه در زمينه مسائل و مباحث تخصصي جمعيت براي انجام تحقيقات جمعيتي در کشور، بيش از دو دهه است که در حوزههای ازدواج، خانواده و فرزندآوري؛ جمعيت، سلامت و طول عمر؛ جمعيت، اقتصاد، سرمايه انساني و بازارکار؛ جمعيت، محيط زيست و توسعه پايدار؛ مهاجرت داخلي و شهرنشيني؛ روشهای آماری و مدلسازي جمعيت در قالب دو پژوهشكده فعاليت مينمايد. اين مؤسسه در راستای مأموریت سازمانی خود، رسالت مهمی را در تحليل مسائل جمعیتی و تدوین سیاستها و برنامهها در اين حوزه به عهده دارد.
از آنجا که یکی از فعالیتهای مؤسسه انتشار گزارشها و کتابهای تخصصی در حوزههای مختلف جمعیتی در راستاي مأموريت مؤسسه و آخرين بند سياستهاي ابلاغي «رصد مستمر سیاستهای جمعیتی در ابعاد کمی و کیفی با ایجاد ساز و کار مناسب و تدوین شاخصهای بومی توسعه انسانی و انجام پژوهشهای جمعیتی و توسعه انسانی» ميباشد؛ کتاب تحليل سابقه رخداد واقعه با استفاده از نرمافزار SAS که به تحليل دادههاي جمعيتي با روشهاي پيشرفته آماري ميپردازد، توسط دو نفر از دانشياران مؤسسه خانمها دکتر آرزو باقري و دکتر مهسا سعادتي تأليف شده است. این کتاب مهم و ارزشمند، حاصل چندین سال مطالعه و انجام طرحهاي پژوهشي مشترک نویسندگان است. تلاش و زحمات ارزشمند ایشان در تألیف کتاب شایسته تقدیر و سپاس ميباشد. همچنین لازم است از ارزیابی، نظارت و دقت نظر دو نفر از اساتید برجسته آمار کشور، جناب آقای دکتر مجتبي گنجعلي و دکتر محمد اصغري جعفرآ بادي در به ثمر رسیدن این کتاب تقدیر و تشکر گردد. امید است این کتاب منبع مهم و ارزشمندی برای پژوهشگران و سیاستگذاران علاقمند به حوزه جمعیت باشد.
جهت سفارش کتاب، با “مسئول کتابخانه و انتشارات”موسسه به شماره داخلی ۱۰۵ تماس حاصل فرمائید.
درباره کتاب:
در بسیاری از مطالعات علوم اجتماعی و پزشکی هدف، بررسی تغییرات جمعیتی در طول زمان میباشد که توصیف آنها برحسب تغییرات زندگی افراد را تاریخچه زندگی[۱] مینامند و به منظور بررسی این تاریخچه، اغلب از تحلیل سابقه رخداد واقعه[۲] استفاده میشود (ویلکنز[۳]، ۲۰۱۴). در تحلیل سابقه رخداد واقعه، سؤالات بسیاری درباره رخداد وقایع[۴] (پیشامدها يا حوادث) در دوره زمانی خاصی از زندگی افراد از جمله تولد و مرگ، اتمام دوره تحصیلی، ازدواج، پیشرفت شغلی، تولد فرزند، طلاق، ترک تحصیل، از دست دادن شغل و مصرف مواد مخدر مطرح میگردند. در این تحلیلها اغلب، زمان تا رخداد واقعه[۵] و نوع وقایع[۶] برآمدهای[۷] مورد نظر پژوهشگر میباشند (اندرسن و کیدینگ[۸]، ۲۰۰۲) و تبیین دلایل بزرگتر بودن مخاطره رخداد واقعه مورد مطالعه برای برخی افراد در مقایسه با سایرین، از اهداف اصلی پژوهش است (ورمونت و مورس[۹]، ۲۰۰۵).
در این مطالعات، روشهای متداول برای تحلیل رخداد واقعه، بدون توجه به زمان وقوع آن، روشهای مدلسازي مانند رگرسیون لوژستيک هستند که به پژوهشگران امکان بررسی ارتباط میان احتمال رخداد واقعه با متغیرهای کمکي[۱۰] مورد نظر را فراهم مینمایند. با اینحال این روشها، اطلاعات موجود در زمان تا رخداد واقعه را نادیده گرفته و تنها احتمال رخداد آن را بررسی میکنند و نمیتوانند به این سؤال که واقعه مورد نظر تا چه زمانی رخ میدهد، پاسخ دهند.
روش آماری صحیح به منظور تحلیل این دادهها، روشهای تحلیل سابقه رخداد واقعه میباشند (کیلی و مارتین[۱۱]، ۲۰۰۵). از آنجا که این روش، نخستین بار برای تحلیل رخداد مرگ توسط آمارشناسان مورد استفاده قرار گرفت، امروزه با نامهای دیگری نظیر تحلیل بقا[۱۲]، تحلیل زمان شکست[۱۳]، تحلیل خطر[۱۴]، تحلیل گذار[۱۵] و تحلیل طول مدت[۱۶] نیز بهکار میرود (کلینبام و کلین[۱۷]، ۲۰۰۸). از تحلیل بقا در مطالعات پزشکی برای مدلسازي زمان رخداد وقایع منفی مانند زمان مرگ یا عود بیماری[۱۸] و وقايع مثبت مانند زمان بهبود بعد از عمل جراحي که هدف آنها تأکید بر طول بقای افراد بعد از ابتلا به بیماریهای خاص میباشد، استفاده میشود (هسمر و لمشو[۱۹]، ۲۰۰۹؛ کلت[۲۰]، ۲۰۰۳). در مطالعات علوم اجتماعی نیز به منظور بررسی وقایع مثبت مانند تولد، اتمام دوره تحصیلی، ازدواج، تولد فرزند، پیشرفت شغلی و بازگشت به کار پس از اخراج و همچنین وقایع منفی مانند مرگ، طلاق، اخراج از شغل و ترک تحصیل از تحلیل بقا با عنوان تحلیل سابقه رخداد واقعه استفاده میگردد (باکس- استفنسمیر و دبوئف[۲۱]، ۲۰۰۶).
تحليل سابقه رخداد واقعه، مجموعهاي از روشهاي آماري براي تحليل دادههايي است كه متغير پاسخ آنها زمان تا رخداد واقعه ميباشد؛ روشهای ناپارامتری[۲۲]، نیمهپارامتری[۲۳] و پارامتری[۲۴] از پرکاربردترین روشها به منظور تحلیل سابقه رخداد وقایعی نظیر فرزندآوری، ازدواج و مرگ هستند که در سالهای اخیر توسط پژوهشگران در حوزههای مختلف علوم اجتماعی و پزشکی مورد استفاده قرار گرفتهاند (رازقی و همکاران، ۱۳۹۳؛ خدیوزاده و همکاران ۱۳۹۳؛ سعادتی و باقری، ۱۳۹۴، a۱۳۹۶ و ۲۰۱۸؛ رحيمي فروشاني و همکاران، ۱۳۹۵؛ باقری و سعادتی، ۱۳۹۶؛ سعادتی و همکاران، ۱۳۹۶ و ۲۰۱۸). روشهای ناپارامتری تحلیل سابقه رخداد واقعه مانند برآوردهای کاپلان- میر[۲۵] و آزمون رتبه- لگاریتمی[۲۶] با اینکه به توصیف اطلاعات موجود در دادهها میپردازند، اما قادر به بررسی تأثیر همزمان متغیرهای پیشبین بر روی متغیر پاسخ نیستند. مدل مخاطرات متناسب کاکس[۲۷]، روشی نیمه پارامتری برای مدلسازي دادههای سابقه رخداد واقعه است که به دلیل عدم نیاز به تعیین توزیع تابع خطر و امتیاز تولید و تفسیر ساده نسبتهای خطر با حداقل پیشفرضها، در عمل کاربرد فراوانی دارد (کلت[۲۸]، ۲۰۰۳). با این وجود مدل مخاطرات متناسب کاکس نیازمند برقراری پیشفرض مخاطرات متناسب است که بدون برقراری آن، تفسیر نتایج گمراهکننده و تحلیلها نامعتبر خواهند بود. مدل کاکس طبقهبندی شده[۲۹] یکی از روشهایی است که در صورت عدم برقراری پیشفرض مخاطرات متناسب، استفاده میشود؛ با این حال در این روش، امکان بررسی متغیری که طبقهبندی براساس آن انجام شده از بین میرود. از سوی دیگر مطالعات مختلف نشان دادهاند که اگر پیشفرضهای یک توزیع احتمال برای دادهها برقرار باشد، استفاده از روشهای پارامتری استنباطهای دقیقتری به دنبال خواهند داشت. مدلهای زمان شکست شتابیده[۳۰] (AFT) یکی از انواع مدلهای پارامتری هستند که در صورت عدم برقراری پیشفرض مخاطرات متناسب، میتوانند جایگزین مناسبی برای این مدلها باشند. در مطالعات مختلف نشان داده شده است که حتی در صورت برقراری پیشفرض مخاطرات متناسب، مدلهای پارامتری برآوردهای ضرایب کاراتری تولید میکنند (سعادتی و باقری، ۱۳۹۴؛ سعادتی و باقری، ۱۳۹۶).
در برخی از مطالعات، تحلیل زمانهای رخداد چندین واقعه به صورت همزمان مانند زمانهای فرزندآوری اول، دوم، سوم و غیره مورد نظر است؛ این وقایع که بیش از یکبار و به صورت ترتیبی برای هر فرد رخ میدهند را وقایع بازگشتی[۳۱] مینامند. این دادهها به دلیل اینکه در طول زمان جمعآوری میشوند و بین وقایع آنها وابستگی وجود دارد، دارای ویژگیهای خاص و ساختار آماري متفاوتی نسبت به زمانهاي بقاي تک متغیره هستند. در تحلیل این دادهها استفاده از مدلهای متداول (نیمهپارامتری و پارامتری) با توجه به اینکه پیشفرض اصلی آنها استقلال دادهها است، منجر به برآورد ناصحیح واریانس و در نتیجه استنباطهای غلط میگردد. در این حالت، به کارگیری روشهای صحیح برای تحلیل این نوع دادهها ضروری مینماید (آمریم[۳۲] و همکاران ۲۰۰۸)؛ در این شرایط باید از مدلهای وقایع بازگشتی بقا شامل مدلهای تصحیح واریانس[۳۳] (مدلهای اندرسون- گیل[۳۴] (AG)، پرنتیس- ویلیامز- پترسون (PWP)[۳۵] و وی- لین- ویسفلد[۳۶] (WLW)) و همچنین مدلهای شکنندگی[۳۷] (شکنندگی مشترک[۳۸]، همبسته[۳۹] و وابسته به زمان[۴۰]) استفاده کرد (پاندیا[۴۱] و همکاران، ۲۰۰۵؛ آمریم، ۲۰۱۵). در سالهای اخیر از این مدلها به منظور مدلسازي وقایع مختلف از جمله تولد فرزندان استفاده شده است (سعادتی و باقری، ۱۳۹۵، b۱۳۹۶؛ باقری و سعادتی، ۱۳۹۶، ۲۰۱۸، ۱۳۹۸ و ۲۰۲۱)
با توجه به اهمیت کاربرد روشهای متداول و پیشرفته تحلیل سابقه رخداد واقعه در علوم اجتماعی و پزشکی، این کتاب به تفصیل به معرفی این روشها میپردازد؛ به علاوه از آنجا که یکی از دلایل عدم به کارگیری این روشها توسط پژوهشگران در مطالعات مختلف، آشنا نبودن آنها با نرمافزارهایی است که به صورت کاربردی این مدلها را روی دادهها برازش میدهند یکی از مهمترین اهداف این کتاب علاوه بر معرفی روشهای تحلیل سابقه رخداد واقعه، نحوه برازش این مدلها با استفاده از نرمافزار SAS براساس دادههای فواصل موالید و تفسیر نتایج آن میباشد؛ بدین منظور در این کتاب، در هر دو فصل متوالی به ترتیب مبانی نظری و روشهای تحلیل سابقه رخداد واقعه معرفی و سپس نحوه برازش و کاربرد این روشها، براساس مجموعه داده فواصل موالید با استفاده از نرمافزار SAS به صورت زیر ارائه شدهاند؛
در فصل اول، مبانی تحلیل سابقه رخداد واقعه شامل تعاریف و مفاهیم واقعه، زمان رخداد واقعه، دادههای سانسورشده[۴۲] و پیشبینهای وابسته به زمان[۴۳] و همچنین مبانی نظری مربوط به توابع بقا و خطر ارائه میگردند.
در فصل دوم به معرفی دادههای فواصل موالید و نرمافزار SAS، نحوه تبدیل (ورود و خروج) دادهها و ایجاد جداول فراوانی در این نرمافزار پرداخته میشود.
در فصل سوم روشهای ناپارامتری تحلیل سابقه رخداد واقعه شامل برآوردهای کاپلان- میر، جدول عمر[۴۴] و نلسون- آلن[۴۵] تابع بقا[۴۶]، خطای استاندارد، بازه[۴۷] و نوار اطمینان[۴۸] برآورد تابع بقا، برآوردهای کاپلان- میر و جدول عمر تابع خطر[۴۹]، برآورد تابع خطر تجمعی و همچنین مقایسه توابع بقا در دو و سه گروه و بیشتر با استفاده از آزمونهای رتبه- لگاریتمی، ویلکاکسون، تارون- ویر[۵۰]، پتو-پتو[۵۱]، پتو-پتو تعدیل شده[۵۲] و فلمینگ- هرینگتون[۵۳] پرداخته خواهد شد.
در فصل چهارم به کاربرد روشهای ناپارامتری تحلیل سابقه رخداد واقعه که در فصل سوم به آنها اشاره شده در تحلیل مجموعه داده فواصل موالید با استفاده از LIFETEST PROC پرداخته میشود؛ در این فصل کلیه برنامهها به صورت کامل تشریح و خروجیهای بدست آمده به تفصیل تفسیر میشوند.
در فصل پنجم مدلهای نیمهپارامتری تحلیل سابقه رخداد واقعه، شامل مدلسازي تابع خطر، مدل مخاطرات متناسب کاکس، نحوه برازش مدل مخاطرات متناسب کاکس، روشهای انتخاب مدل، تفسیر برآورد پارامترها، ارزیابی اعتبار مدل مخاطرات متناسب کاکس با استفاده از ماندهها[۵۴]، روشهای ارزیابی پیشفرض مخاطرات متناسب و مدل کاکس طبقهبندی شده معرفی میگردند.
در فصل ششم از PHREG PROC به منظور برازش روشهای نیمهپارامتری تحلیل سابقه رخداد واقعه که در فصل پنجم ارائه شده برای تحلیل مجموعه داده فواصل موالید استفاده میگردد. در این فصل کلیه برنامهها به صورت کامل تشریح و خروجیهای بدست آمده به تفصیل تفسیر میشوند.
در فصل هفتم مدلهای پارامتری تحلیل سابقه رخداد واقعه ارائه خواهند شد؛ در این فصل ابتدا توابع توزیع بقا و خطر هر یک از مدلهای پارامتری بقا شامل توزیعهای نمایی[۵۵]، وایبل[۵۶]، گامپرتز[۵۷]، لگ- لوژستيک[۵۸]، لگ- نرمال[۵۹] و گاما[۶۰] ، سپس مدلهای مخاطرات متناسب نمایی، وایبل و گامپرتز و مدلهای زمان شکست شتابیده نمایی، وایبل و لگ-لوژستيک و در انتها مدلهای شکنندگی بقا معرفی میگردند.
در فصل هشتم به کاربرد مدلهای پارامتری تحلیل سابقه رخداد واقعه که در فصل هفتم به آنها اشاره شده در تحلیل مجموعه داده فواصل موالید با استفاده از LIFEREG PROC و NLMIXED PROC پرداخته میشود؛ در این فصل کلیه برنامهها به صورت کامل تشریح و خروجیهای بدست آمده به تفصیل تفسیر میشوند.
در فصل نهم به معرفی مدلهای وقايع بازگشتي تحلیل سابقه رخداد وقايع شامل مدلهای تصحیح واریانس بازگشتی AG، PWP و WLW و مدلهای شکنندگی بازگشتی بقا به همراه برآورد ضرایب و مقایسه این مدلها پرداخته خواهد شد.
در فصل دهم با توجه به اینکه ساختار دادهها در مدلهای بازگشتی بقا با مدلهای سابقه رخداد واقعه در فصلهای قبل متفاوت میباشد، ابتدا به معرفی انواع ساختار داده در برازش مدلهای بازگشتی بقا پرداخته میشود؛ سپس از مدلهای وقايع بازگشتي تحلیل سابقه رخداد وقايع که در فصل نهم ارائه گردیده به منظور تحلیل مجموعه داده فواصل موالید با استفاده از PHREG PROC پرداخته میشود. در این فصل کلیه برنامهها به صورت کامل تشریح و خروجیهای بدست آمده به تفصیل تفسیر میشوند.
[۱] Life historiy
[۲] Event history analysis
[۳] Willekens
[۴] Events
[۵] Time-to-event
[۶] Type of events
[۷] Outcomes
[۸] Andersen & Keiding
[۹] Vermunt & Moors
[۱۰] Covariates
[۱۱] Keiley & Martin
[۱۲] Survival analysis
[۱۳] Failure time analysis
[۱۴] Hazard analysis
[۱۵] Transition analysis
[۱۶] Duration analysis
[۱۷] Kleinbaum & Klein
[۱۸] Relapse
[۱۹] Hosmer & Lemeshow
[۲۰] Collett
[۲۱] Box-Steffensmeier & DeBoef
[۲۲] Non- parametric
[۲۳] Semi- parametric
[۲۴] Parametric
[۲۵] Kapplan- Meir
[۲۶] Log-Rank
[۲۷] Cox Proportional Hazards
[۲۸] Collett
[۲۹] Stratified Cox regression
[۳۰] Accelerated Failure Time models
[۳۱] Recurrent events
[۳۲] Amorim
[۳۳] Variance corrected models
[۳۴] Anderson-Gill
[۳۵] Prentice-Williams -Peterson
[۳۶] Wei-Lin-Weissfeld
[۳۷] Frailty
[۳۸] Shared
[۳۹] Correlated
[۴۰] Time- dependent
[۴۱] Pandeya
[۴۲] Censored data
[۴۳] Time-dependent covariates
[۴۴] Life table
[۴۵] Nelson-Aalen
[۴۶] Survival function
[۴۷] Confidence interval
[۴۸] Confidence band
[۴۹] Hazard function
[۵۰] Tarone-Ware
[۵۱] Peto-Peto
[۵۲] Modified Peto-Peto
[۵۳] Fleming-Harrington
[۵۴] Residuals
[۵۵] Exponential
[۵۶] Weibull
[۵۷] Log-Logistic
[۵۸] Log-Normal
[۵۹] Gompertz
[۶۰] Gamma