علم داده اجتماعی در خدمت برابری اجتماعی: پیشبینی و پیشگیری از بیخانمانی به کمک یادگیری ماشین

مقدمه: پیشبینی و پیشگیری از بیخانمانی به کمک یادگیری ماشین
علم داده اجتماعی میتواند با دگرگون ساختن سیاستگذاری سنتی و گذار به سیاستگذاری و تصمیمگیری دادهمحور، مسائل مختلف اجتماعی، فرهنگی و اقتصادی را با رویکردی نوین هدف بگیرد.
در لسآنجلس، بهعنوان یکی از کانونهای اصلی بیخانمانی در ایالات متحده، تلاش شد تا با بهکارگیری علم داده، یادگیری ماشین و سیاستگذاری دادهمحور، این معضل اجتماعی با رویکردی جدید حل شود. پروژهی پیشبینی بیخانمانی در لسآنجلس یکی از نمونههای برجستهی بهکارگیری علم دادهی اجتماعی برای حل و فصل یک معضل اجتماعی مهم به نام بیخانمانی تبدیل شد. با علم دادهی اجتماعی با بهکارگیری یادگیری ماشین، اشخاص و خانوادههایی را که در معرض ریسک بیخانمانی قرار دارند را پیش از وقوع بحران شناسایی میکند و با مداخلات فعالانه مناع مالی و اجتماعی موجود را با نیازهای فوری همراستا میسازد. این پروژه قدرت دگرگونکنندی رویکردهای دادهمحور در حوزه سیاست اجتماعی را به خوبی نمایش میدهد؛ نوآوریهای فناورانه را با اهداف انسانی در جهت خلق راهحلهای مقیاسپذیر برای کمک به قشر آسیبپذیر ترکیب میکند.
زمینه شکلگیری پروژه: کاربرد علم داده اجتماعی در لسآنجلس
اداره خدماتدهی به افراد بیخانمان در لس آنجلس (LAHSA) با ابتکاری مبتنی بر علم داده، رویکردی فعالانه برای مقابله با بیخانمانی و بهبود برابری اجتماعی اتخاذ کرد.”در سال ۲۰۱۹، آزمایشگاه خطمشی کالیفرنیا در دانشگاه شیکاگو به یاری اداره خدمات بیخانمان لسآنجلس(LAHSA) آمدند و پروژهای را آغاز کردند که هدف آن ایجاد یک سیستم پیشبینی مبتنی بر داده برای شناسایی افراد و خانوادههای در معرض خطر بیخانمانی بود. این پروژه بهواسطه شرکت مشاور داده ELP، دادههای گستردهای از ۱۵ سازمان دولتی و شهری گردآوری کرد. سیاستگذاران امیدوار بودند که با بهرهگیری از تحلیل پیشبینیمحور، بتوانند بهجای کمک بعد از وقوع بحران، قبل از آن مداخله کنند.
رویکرد دادهمحور به مسئله اجتماعی بیخانمانی: از بحران انسانی به بحران ساختاری و سیستمی
رویکرد سنتی مقابله با بیخانمانی، بیشتر متمرکز بر واکنشهای پس از وقوع بحران بود؛ یعنی حمایت از افراد پس از بیخانمانشدن. اما در این پروژه، بیخانمانی نه یک رویداد فردی یا انسانی، بلکه نتیجهای ساختاری از شکستهای مکرر در نظام بازار، سیاستهای مسکن، نابرابریهای نژادی و طبقاتی، و کمتوجهی به پیشگیری تلقی شد. بنابراین، تمرکز اصلی بهجای «واکنش»، بر «پیشگیری ساختاری» قرار گرفت. لذا ادراک از بیخانمانی به عنوان صرف یک بحران انسانی به یک بحران ناشی از شکست سیتماتیک و پیچیده تغییر کرد. در رویکردهای سنتی به بیخانمانی (اسکان موقت و تأمین سرپناه به شکل منفعلانه) عمدتاً کاری به ریشهها و دلایل بیخانمان شدن افراد ندارند، حال آنکه افزایش فزایندهی میانگین نرخ اجاره بهای مسکن فراتر از سطوح افزایش دستمزدها، کمبود مسکن با قیمت پایین و متناسب با توانمندی مالی اقشار کمدرآمد (تنها 25 درصد اقشار کمدرآمد به مسکنهای اجارهای یارانهای دسترسی دارند)، و نابرابریهای ساختاری، ریشههای شکست سیستماتیک و بیخانمان شدن افراد در لسآنجلس هستند.
بازطراحی سیاستهای اجتماعی با کمک الگوریتمهای یادگیری ماشین: :گذار از «مدیریت بحران» به سمت «پیشگیری از بیخانمانی»
سیاستگذاران در این پروژه با ترکیب الگوریتمهای یادگیری ماشین دادههای اقتصادی-اجتماعی تلاش کردند تا به جای اعطای خانه به افراد بیخانمانشده افرادی را که در معرض ریسک بیخانمان شدن قرار دارند، شناسایی کنند و از طریق اقدامات حمایتی لازم مانع از بیخانمان شدن آنها شوند؛ همچنین با تخصیصهای دقیقتر و هدفمندتر، در جهت تسکین معضل بیخانمانی و کاهش نابرابری اجتماعی گام بردارند. در رویکرد استفاده از علم داده برای گسترش برابری اجتماعی، تلاش شد که مسئله صورتبندی جدیدی پیدا کند و پرسش اصلی از «چگونه افراد بیخانمان را اسکان دهیم؟» به این پرسش تغییر یافت:
«چه کسانی ممکن است در ۶ تا ۱۲ ماه آینده بیخانمان شوند؟ و چه مداخلاتی (مانند کمک به پرداخت اجاره، حمایت رواندرمانی و خدمات بهداشتی) میتواند بیشترین تأثیر را در کاهش این ریسک داشته باشد؟»
این تغییر دیدگاه سیاستی به خلق یک مدل پیشبینی منجر شد که به سیاستگذاران اجازه میداد بر اساس دادههای تاریخی، «احتمال بیخانمانشدن» هر فرد را محاسبه کرده و بر آن اساس تصمیمگیری کنند.
داده اجتماعی در عمل: از گردآوری تا مدلسازی
برای ساخت مدل، لازم بود دادههای متعدد و مجزای نهادی با هم ترکیب شود. بیش از ۸۵ میلیون رکورد اطلاعاتی از منابع زیر جمعآوری شد:
- پروندههای خدمات اجتماعی و بهزیستی
- سوابق قضایی، زندان، و دادگاه
- دادههای سلامت و مراجعات درمانی
- ثبتنامها در برنامههای یارانهای مسکن و سایر کمکهای دولتی
- اطلاعات آموزش و اشتغال
دادهها از بیش از 15 منبع مختلف شامل سازمانهای دولتی، مؤسسات غیرانتفاعی و تأمینکنندگان خدمات سلامت گردآوری شدند؛ به کمک شرکت پروژهی اتصال (ELP) مجموعاً 85 میلیون رکورد داده گردآوری و یکپارچهسازی شد.
چالشهای مرتبط با گردآوری و یکپارچهسازی دادهها
مهمترین چالش، مسائل مربوط به حریم خصوصی و ناشناسسازی دادهها بود، زیرا برخی اطلاعات حساس (مانند دادههای سلامت و مالی) نیاز به پردازش ویژه داشتند؛ همچنین دادهها از آنجا که در دپارتمانهای مختلف دولتی تولید شدهاند، از لحاظ فرمت و نوع سازماندهی با یکدیگر تطبیق نداشتند؛ برخی در قالب گزارش و فایل پی دی اف و برخی به شکل اکسل و برخی دیگر در قابل پایگاههای داده منتشر شده بودند. همچنین این دادهها دارای سوگیری بودند، چرا که بازتابدهندهی نابرابریهای سیستماتیک در جامعهی امریکا بودند؛ نابرابریهایی مثل نظارت پلیسی گسترده بر سیاهان (و در نتیجه مجرمسازی غیرمنصفانه سیاهان) و یا شکافهای درآمدی اقلیتها نسبت به سیاهپوستان که به صورت تاریخی شکل گرفته و انباشت شده است. برای مدیریت این چالشها، تیم فنی مدلهایی برای شناسایی و تصحیح سوگیریها طراحی و اجرا کرد.
یکپارچهسازی و پیشپردازش دادهها
در فرآیند یکپارچهسازی دادهها از تکنیکهای تطبیق فازی و الگوریتمهای پاکسازی استفاده شد. در مرحله اول، دادههای مربوط به هر فرد از منابع مختلف با استفاده از روش تطابق فازی شناسایی و به هم مرتبط شدند. سپس با استفاده از تکنیکهای مهندسی ویژگی، شاخصهای نشانگر ریسک بالا تعریف شدند:
- هزینهکرد بیش از ۵۰٪ درآمد فرد برای اجارهبها
- مراجعات مکرر به اورژانس در بازه سه ماهه
در نهایت، برای کاهش سوگیری موجود در دادهها، دو اقدام اصلی انجام گرفت: وزندهی مجدد دادههاو کاهش تأثیر گروههایی که در نمونهگیری بیش از حد بازنمایی شده بودند.
مدلسازی مسئلهی اجتماعی بیخانمانی با الگوریتمهای یادگیری ماشین
تیم هدایتگر پروژه یک مدل طبقهبندی ریسک ایجاد کردند که ریسک بیخانمان شدن افراد را از صفر تا صد (0-100) در نظر میگرفت. مدل اینطور کار میکرد که فردی که نمرهی 100 کسب میکرد، قطعا بیخانمان میشد و نمره صفر بدین معنا بود که فرد به هیچ وجه بیخانمان نخواهد شد. هدف مدل پیشبینی، شناسایی افرادی بود که در ۱۲ ماه آینده احتمال بیخانمانشدن دارند. بنابراین، متغیر هدف (target variable) بهصورت دودویی تعریف شد:
- ۱= فرد در ۱۲ ماه آینده بیخانمان شده است
- ۰= فرد بیخانمان نشده است
این مدل صدها متغیر را بررسی میکند تا خانوادههایی که با احتمال قوی دچار بیخانمانی میشوند، شناساییکند؛ متغیرها در سهدستهی اصلی اقتصادی، اجتماعی و سلامت ئ بهداشت قرار میگیرند.
الگوریتمهای جنگل تصادفی، شبکه عصبی ساده و آزمون سایر مدلهای یادگیری ماشین برای افزایش دقت و کاهش خاصبودگی بیش از حد (overfitting) مورد استفاده قرار گرفتند. مدل با دادههای به 450 هزار نفر و متعلق به سالهای ۲۰۱۰ تا ۲۰۱۸ آموزش داده شد و سپس تست و اعتبارسنجی مدل بر روی دادههای به همین افراد و متعلق به سالهای 2019 و 2020 انجام شد.
خروجی مدل یادگیری ماشین: مداخلات هدفمند اجتماعی برای پیشگیری از بیخانمانی
افرادی که به تشخیص مدل دارای ریسک بالا شناسایی میشوند، جهت یک یا چند نوع از مداخلات زیر به مددکاران اداره خدماتدهی به افراد بیخانمان در لس آنجلس (LAHSA) معرفی میشوند:
- اعطای کمکهزینهی اجارهخانه: افرادی که ریسک بیخانمانی آنها بالای 70 تشخیص داده میشد، یارانههای هدفمند برای پرداخت اجارهبهای محل سکونتشان دریافت میکنند.
- یاریگری برای سلامت روانی: از طریق همکاری با کلینکهای درمانی به افراد دارای ریسک بالا کمک میشد تا به مشاوران سلامتروان دسترسی پیدا کنند.
- معاضدت حقوقی: هزینههای حقوقی مستأجرانی که با پروندههای تخلیه (اخراج از مسکن) در دادگاه دستوپجه نرم میکنند، پوشش داده میشود.
دستاوردهای سیاست اجتماعی دادهمحور و مبتنی بر داده اجتماعی
نتایج اولیه از زمان اجرای پروژه (۲۰۲۰ تا ۲۰۲۲) به شرح زیر بوده است:
- ۱۵٪ کاهش در نرخ بیخانمانی مزمن
- ۳۰٪ افزایش در تخصیص منابع و شناسایی زودهنگام افراد در معرض خطر بیخانمانی
- صرفهجوییی در هزینههای عمومی: هر 1 دلار سرمایهگذاری در مداخله پیشگیرانه به طور میانگین منجر به ۴ دلار صرفهجویی در هزینههای عمومی (مانند اورژانس، زندان، خدمات درمانی و…) شد.
دلالتها برای علم دادهی اجتماعی
نتایج پروژهی اقدام پیشگیرانه برای مقابله با بیخانمانی در لسآنجلس نشان میدهد که علم داده اجتماعی چگونه میتواند با کنار هم گردآوردن دانشمندان علم داده، مددکاران اجتماعی وسیاستگذاران، میان نوآوریهای فناورانه و اثرگذاری اجتماعی پل بزند. همچنین در این پروزه یک نوآاوری سیاستگذارانه هم دیده میشد که به جای مدیریت بحران، تلاش میکند مداخله فعالانه و پیشگیرانهای در مواجهه با بیخانمانی انجام دهد. این پروژهی الهامبخش قابلیت تکثیر شدن و مقیاسپذیری برای شهرها و کشورهایی که با این معضل دستوپنجه نرممیکنند را دارد. تجربه لسآنجلس الگویی قابل اقتباس برای شهرها و کشورهایی است که بهدنبال طراحی سیاستهای پیشگیرانه و دادهمحور اجتماعی هستند.