علم داده اجتماعی در خدمت برابری اجتماعی: پیش‌بینی و پیشگیری از بی‌خانمانی به کمک یادگیری ماشین

این یک متن alt تصویر است
آنچه در این پست میخوانید

    مقدمه: پیشبینی و پیشگیری از بیخانمانی به کمک یادگیری ماشین

    علم داده اجتماعی می‌تواند با دگرگون ساختن سیاستگذاری سنتی و گذار به سیاستگذاری و تصمیم‌گیری داده‌محور، مسائل مختلف اجتماعی، فرهنگی و اقتصادی را با رویکردی نوین هدف بگیرد.
    در لس‌آنجلس، به‌عنوان یکی از کانون‌های اصلی بی‌خانمانی در ایالات متحده، تلاش شد تا با به‌کارگیری علم داده، یادگیری ماشین و سیاستگذاری داده‌محور، این معضل اجتماعی با رویکردی جدید حل شود. پروژه‌ی پیش‌بینی بی‌خانمانی در لس‌آنجلس یکی از نمونه‌های برجسته‌ی به‌کارگیری علم داده‌ی اجتماعی برای حل و فصل یک معضل اجتماعی مهم به نام بی‌خانمانی تبدیل شد. با علم داده‌ی اجتماعی با به‌کارگیری یادگیری ماشین، اشخاص و خانواده‌هایی را که در معرض ریسک بی‌خانمانی قرار دارند را پیش از وقوع بحران شناسایی می‌کند و با مداخلات فعالانه مناع مالی و اجتماعی موجود را با نیازهای فوری همراستا می‌سازد. این پروژه قدرت دگرگون‌کنند‌ی رویکردهای داده‌محور در حوزه سیاست اجتماعی را به خوبی نمایش می‌دهد؛ نوآوری‌های فناورانه را با اهداف انسانی در جهت خلق راه‌حل‌های مقیاس‌پذیر برای کمک به قشر آسیب‌پذیر ترکیب می‌کند.

    زمینه شکل‌گیری پروژه: کاربرد علم داده اجتماعی در لس‌آنجلس

    اداره خدمات‌دهی به افراد بی‌خانمان در لس آنجلس (LAHSA) با ابتکاری مبتنی بر علم داده، رویکردی فعالانه برای مقابله با بی‌خانمانی و بهبود برابری اجتماعی اتخاذ کرد.”در سال ۲۰۱۹، آزمایشگاه خط‌مشی کالیفرنیا در دانشگاه شیکاگو به یاری اداره خدمات بی‌خانمان لس‌آنجلس(LAHSA) آمدند و پروژه‌ای را آغاز کردند که هدف آن ایجاد یک سیستم پیش‌بینی مبتنی بر داده برای شناسایی افراد و خانواده‌های در معرض خطر بی‌خانمانی بود. این پروژه به‌واسطه شرکت مشاور داده ELP، داده‌های گسترده‌ای از ۱۵ سازمان دولتی و شهری گردآوری کرد. سیاستگذاران امیدوار بودند که با بهره‌گیری از تحلیل پیش‌بینی‌محور، بتوانند به‌جای کمک بعد از وقوع بحران، قبل از آن مداخله کنند.

    رویکرد داده‌محور به مسئله اجتماعی بی‌خانمانی: از بحران انسانی به بحران ساختاری و سیستمی

    رویکرد سنتی مقابله با بی‌خانمانی، بیشتر متمرکز بر واکنش‌های پس از وقوع بحران بود؛ یعنی حمایت از افراد پس از بی‌خانمان‌شدن. اما در این پروژه، بی‌خانمانی نه یک رویداد فردی یا انسانی، بلکه نتیجه‌ای ساختاری از شکست‌های مکرر در نظام بازار، سیاست‌های مسکن، نابرابری‌های نژادی و طبقاتی، و کم‌توجهی به پیشگیری تلقی شد. بنابراین، تمرکز اصلی به‌جای «واکنش»، بر «پیشگیری ساختاری» قرار گرفت. لذا ادراک از بی‌خانمانی به عنوان صرف یک بحران انسانی به یک بحران ناشی از شکست سیتماتیک و پیچیده تغییر کرد. در رویکردهای سنتی به بی‌خانمانی (اسکان موقت و تأمین سرپناه به شکل منفعلانه) عمدتاً کاری به ریشه‌ها و دلایل بی‌خانمان شدن افراد ندارند، حال آنکه افزایش فزاینده‌ی میانگین نرخ اجاره‌ بهای مسکن فراتر از سطوح افزایش دستمزدها، کمبود مسکن با قیمت پایین و متناسب با توانمندی مالی اقشار کم‌درآمد (تنها 25 درصد اقشار کم‌درآمد به مسکن‌های اجاره‌ای یارانه‌ای دسترسی دارند)، و نابرابری‌های ساختاری، ریشه‌های شکست سیستماتیک و بی‌خانمان شدن افراد در لس‌آنجلس هستند.

    بازطراحی سیاست‌های اجتماعی با کمک الگوریتم‌های یادگیری ماشین: :گذار از «مدیریت بحران» به سمت «پیشگیری از بی‌خانمانی»

    سیاستگذاران در این پروژه با ترکیب الگوریتم‌های یادگیری ماشین داده‌های اقتصادی-اجتماعی تلاش کردند تا به جای اعطای خانه به افراد بی‌خانمان‌شده افرادی را که در معرض ریسک بی‌خانمان شدن قرار دارند، شناسایی کنند و از طریق اقدامات حمایتی لازم مانع از بی‌خانمان شدن آن‌ها شوند؛ همچنین با تخصیص‌های دقیق‌تر و هدفمندتر، در جهت تسکین معضل بی‌خانمانی و کاهش نابرابری اجتماعی گام بردارند. در رویکرد استفاده از علم داده برای گسترش برابری اجتماعی، تلاش شد که مسئله صورت‌بندی جدیدی پیدا کند و پرسش اصلی از «چگونه افراد بی‌خانمان را اسکان دهیم؟» به این پرسش تغییر یافت:

    «چه کسانی ممکن است در ۶ تا ۱۲ ماه آینده بی‌خانمان شوند؟ و چه مداخلاتی (مانند کمک به پرداخت اجاره، حمایت روان‌درمانی و خدمات بهداشتی) می‌تواند بیشترین تأثیر را در کاهش این ریسک داشته باشد؟»

    این تغییر دیدگاه سیاستی به خلق یک مدل پیش‌بینی منجر شد که به سیاست‌گذاران اجازه می‌داد بر اساس داده‌های تاریخی، «احتمال بی‌خانمان‌شدن» هر فرد را محاسبه کرده و بر آن اساس تصمیم‌گیری کنند.

    داده اجتماعی در عمل: از گردآوری تا مدل‌سازی

    برای ساخت مدل، لازم بود داده‌های متعدد و مجزای نهادی با هم ترکیب شود. بیش از ۸۵ میلیون رکورد اطلاعاتی از منابع زیر جمع‌آوری شد:

    • پرونده‌های خدمات اجتماعی و بهزیستی
    • سوابق قضایی، زندان، و دادگاه
    • داده‌های سلامت و مراجعات درمانی
    • ثبت‌نام‌ها در برنامه‌های یارانه‌ای مسکن و سایر کمک‌های دولتی
    • اطلاعات آموزش‌ و اشتغال

    داده‌ها از بیش از 15 منبع مختلف شامل سازمان‌های دولتی، مؤسسات غیرانتفاعی و تأمین‌کنندگان خدمات سلامت گردآوری شدند؛ به کمک شرکت پروژه‌ی اتصال (ELP) مجموعاً 85 میلیون رکورد داده گردآوری و یکپارچه‌سازی شد.

    چالش‌های مرتبط با گردآوری و یکپارچه‌سازی داده‌ها

    مهم‌ترین چالش، مسائل مربوط به حریم خصوصی و ناشناس‌سازی داده‌ها بود، زیرا برخی اطلاعات حساس (مانند داده‌های سلامت و مالی) نیاز به پردازش ویژه داشتند؛ همچنین داده‌ها از آنجا که در دپارتمان‌های مختلف دولتی تولید شده‌اند، از لحاظ فرمت و نوع سازماندهی با یکدیگر تطبیق نداشتند؛ برخی در قالب گزارش و فایل پی دی اف و برخی به شکل اکسل و برخی دیگر در قابل پایگاه‌های داده منتشر شده بودند. همچنین این داده‌ها دارای سوگیری بودند، چرا که بازتاب‌دهنده‌ی نابرابری‌های سیستماتیک در جامعه‌ی امریکا بودند؛ نابرابری‌هایی مثل نظارت پلیسی گسترده بر سیاهان (و در نتیجه مجرم‌سازی غیرمنصفانه سیاهان) و یا شکاف‌های درآمدی اقلیت‌ها نسبت به سیاهپوستان که به صورت تاریخی شکل گرفته و انباشت شده است. برای مدیریت این چالش‌ها، تیم فنی مدل‌هایی برای شناسایی و تصحیح سوگیری‌ها طراحی و اجرا کرد.

    یکپارچه‌سازی و پیش‌پردازش داده‌ها

    در فرآیند یکپارچه‌سازی داده‌ها از تکنیک‌های تطبیق فازی و الگوریتم‌های پاک‌سازی استفاده شد. در مرحله اول، داده‌های مربوط به هر فرد از منابع مختلف با استفاده از روش تطابق فازی شناسایی و به هم مرتبط شدند. سپس با استفاده از تکنیک‌های مهندسی ویژگی، شاخص‌های نشانگر ریسک بالا تعریف شدند:

    • هزینه‌کرد بیش از ۵۰٪ درآمد فرد برای اجاره‌بها
    • مراجعات مکرر به اورژانس در بازه سه ماهه

    در نهایت، برای کاهش سوگیری موجود در داده‌ها، دو اقدام اصلی انجام گرفت: وزن‌دهی مجدد داده‌هاو کاهش تأثیر گروه‌هایی که در نمونه‌گیری بیش از حد بازنمایی شده بودند.

    مدل‌سازی مسئله‌ی اجتماعی بی‌خانمانی با الگوریتم‌های یادگیری ماشین

    تیم هدایتگر پروژه یک مدل طبقه‌بندی ریسک ایجاد کردند که ریسک بی‌خانمان شدن افراد را از صفر تا صد (0-100) در نظر می‌گرفت. مدل این‌طور کار می‌کرد که فردی که نمره‌ی 100 کسب می‌کرد، قطعا بی‌خانمان می‌شد و نمره صفر بدین معنا بود که فرد به‌ هیچ وجه بی‌خانمان نخواهد شد. هدف مدل پیش‌بینی، شناسایی افرادی بود که در ۱۲ ماه آینده احتمال بی‌خانمان‌شدن دارند. بنابراین، متغیر هدف (target variable) به‌صورت دودویی تعریف شد:

    • ۱= فرد در ۱۲ ماه آینده بی‌خانمان شده است
    • ۰= فرد بی‌خانمان نشده است

    این مدل صدها متغیر را بررسی می‌کند تا خانواده‌هایی که با احتمال قوی دچار بی‌خانمانی می‌شوند، شناسایی‌کند؛ متغیرها در سه‌دسته‌ی اصلی اقتصادی، اجتماعی و سلامت ئ بهداشت قرار می‌گیرند.

    الگوریتم‌های جنگل تصادفی، شبکه عصبی ساده و آزمون سایر مدل‌های یادگیری ماشین برای افزایش دقت و کاهش خاص‌بودگی بیش از حد (overfitting) مورد استفاده قرار گرفتند. مدل با داده‌های به 450 هزار نفر و متعلق به سال‌های ۲۰۱۰ تا ۲۰۱۸ آموزش داده شد و سپس تست و اعتبارسنجی مدل بر روی داده‌های به همین افراد و متعلق به سال‌های 2019 و 2020 انجام شد.

    خروجی مدل یادگیری ماشین: مداخلات هدفمند اجتماعی برای پیشگیری از بی‌خانمانی

    افرادی که به تشخیص مدل دارای ریسک بالا شناسایی می‌شوند، جهت یک یا چند نوع از مداخلات زیر به مددکاران اداره خدمات‌دهی به افراد بی‌خانمان در لس آنجلس (LAHSA) معرفی می‌شوند:

    • اعطای کمک‌هزینه‌ی اجاره‌خانه: افرادی که ریسک بی‌خانمانی آن‌ها بالای 70 تشخیص داده می‌شد، یارانه‌های هدفمند برای پرداخت اجاره‌بهای محل سکونتشان دریافت می‌کنند.
    • یاری‌گری برای سلامت روانی: از طریق همکاری با کلینک‌های درمانی به افراد دارای ریسک بالا کمک می‌شد تا به مشاوران سلامتروان دسترسی پیدا کنند.
    • معاضدت حقوقی: هزینه‌های حقوقی مستأجرانی که با پرونده‌های تخلیه (اخراج از مسکن) در دادگاه دست‌وپجه نرم می‌کنند، پوشش داده می‌شود.

    دستاوردهای سیاست اجتماعی داده‌محور و مبتنی بر داده اجتماعی

    نتایج اولیه از زمان اجرای پروژه (۲۰۲۰ تا ۲۰۲۲) به شرح زیر بوده است:

    • ۱۵٪ کاهش در نرخ بی‌خانمانی مزمن
    • ۳۰٪ افزایش در تخصیص منابع و شناسایی زودهنگام افراد در معرض خطر بی‌خانمانی
    • صرفه‌جوییی در هزینه‌های عمومی: هر 1 دلار سرمایه‌گذاری در مداخله پیشگیرانه به طور میانگین منجر به ۴ دلار صرفه‌جویی در هزینه‌های عمومی (مانند اورژانس، زندان، خدمات درمانی و…) شد.

    دلالت‌ها برای علم داده‌ی اجتماعی

    نتایج پروژه‌ی اقدام پیشگیرانه برای مقابله با بی‌خانمانی در لس‌آنجلس نشان می‌دهد که علم داده اجتماعی چگونه می‌تواند با کنار هم گردآوردن دانشمندان علم داده، مددکاران اجتماعی وسیاستگذاران، میان نوآوری‌های فناورانه و اثرگذاری اجتماعی پل بزند. همچنین در این پروزه یک نوآاوری سیاستگذارانه هم دیده می‌شد که به جای مدیریت بحران، تلاش می‌کند مداخله فعالانه‌ و پیشگیرانه‌ای در مواجهه با بی‌خانمانی انجام دهد. این پروژه‌ی الهام‌بخش قابلیت تکثیر شدن و مقیاس‌پذیری برای شهرها و کشورهایی که با این معضل دست‌وپنجه نرم‌می‌کنند را دارد. تجربه لس‌آنجلس الگویی قابل اقتباس برای شهرها و کشورهایی است که به‌دنبال طراحی سیاست‌های پیشگیرانه و داده‌محور اجتماعی هستند.

    Related posts

    Don't miss reading these posts!

    وبینار دوره علم داده اجتماعی ASDS

    آنچه در این پست میخوانید وبینار آشنایی با دوره «علم داده اجتماعی» فرصتی برای گفت‌وگو و دریافت اطلاعات کامل پیش…

    Read more

    تیزر دوره علم داده اجتماعی (۲)

    آنچه در این پست میخوانید معرفی دوره ی جامع حرفه ای و کاربردی علم داده اجتماعی (ASDS) در دانشکده علوم…

    Read more

    تیزر دوره علم داده اجتماعی (۱)

    آنچه در این پست میخوانید معرفی دوره ی جامع حرفه ای و کاربردی علم داده اجتماعی (ASDS) در دانشکده علوم…

    Read more

    Comments

    Share your comments with us

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *