تشخیص شرایط جدید و در حال ظهور مواد مخدر با استفاده از پردازش زبان طبیعی: یک مطالعه رسانه های اجتماعی

Format
Scientific article
Publication Date
Published by / Citation
Simpson SS, Adams N, Brugman CM, Conners TJ Detecting Novel and Emerging Drug Terms Using Natural Language Processing: A Social Media Corpus Study JMIR Public Health Surveill 2018;4(1):e2 URL: https://publichealth.jmir.org/2018/1/e2 DOI: 10.2196/publichealth.7726 PMID: 29311050
Original Language

انگلیسی

Country
ایالات متحده آمریکا
Keywords
natural language processing
street drugs
social media
vocabulary
Twitter

تشخیص شرایط جدید و در حال ظهور مواد مخدر با استفاده از پردازش زبان طبیعی: یک مطالعه رسانه های اجتماعی

آبستره

سابقه و هدف:  با توسعه سریع مواد روانگردان جدید (NPS) و تغییرات در استفاده از داروهای سنتی تر، به طور فزاینده ای دشوار است برای محققان و دست اندر کاران بهداشت عمومی به نگه دارید تا با داروهای در حال ظهور و شرایط مواد مخدر است. بررسی های مصرف مواد و ابزار تشخیصی باید قادر به پرسیدن در مورد مواد با استفاده از شرایطی که مصرف کنندگان مواد مخدر خود را به احتمال زیاد با استفاده از. تجزیه و تحلیل رسانه های اجتماعی ممکن است راه های جدیدی برای محققان برای کشف و پیگیری تغییرات در شرایط مواد مخدر در زمان نزدیک به زمان واقعی ارائه دهد. این مطالعه نتایج اولیه حاصل از همکاری نوآورانه بین همه گیرشناسان مصرف مواد و دانشمندان زبان شناسی را توصیف می کند که تکنیک هایی را از زمینه پردازش زبان طبیعی برای بررسی شرایط مربوط به مواد مخدر در نمونه ای از توییت های ایالات متحده به کار می گیرند.

هدف:  هدف از اين مطالعه بررسی امکان استفاده از جاسازي های کلمه-ناقون توزیع شده آموزش دیده بر روی داده های رسانه های اجتماعی برای کشف اصطلاحات دارویی ناشناخته قبلی (به محققان) بود.

روش ها: در این مطالعه خلبانی، ما یک مدل پیوسته از کلمات (CBOW) از جاسازهای کلمه-ناقوس توزیع شده بر روی مجموعه داده های توییتر جمع آوری شده در طول جولای 2016 (تقریبا 884.2 میلیون نشانه) را آموزش دادیم. ما از جاهای سازی کلمه آموزش دیده برای شرایط با شباهت کسینس بالا (یک پراکسی برای ارتباط زمانی) به اصطلاحات شناخته شده زبان زنگی برای ماری جوانا برای تولید یک لیست از شرایط نامزد به احتمال زیاد به عنوان شرایط زبان زنگی برای این ماده عمل می کنند. این لیست نامزدها سپس با یک لیست متخصص تولید شده از شرایط ماری جوانا برای ارزیابی دقت و اثر بخشی استفاده از جاسازهای کلمه وکتور برای جستجوی اصطلاحات جدید مواد مخدر مقایسه شد.

يافته ها: روشی که در اينجا شرح داده شد، فهرستی از 200 مورد نامزد را برای ماده هدف (ماری جوانا) تهيه کرد. از این 200 نامزد، 115 نفر در واقع به ماری جوانا مربوط (65 شرایط برای خود ماده، 50 شرایط مربوط به پارافرنالیا) مصمم بودند. این شامل 30 اصطلاح که برای اشاره به ماده هدف در کورپس استفاده شد هنوز در لیست متخصص تولید شده ظاهر نمی شود و بنابراین به عنوان موارد موفق کشف اصطلاحات دارویی جدید در نظر گرفته شد. چند تن از این اصطلاحات جدید به نظر می رسد به تازگی به عنوان 1 یا 2 ماه قبل از برش زمان کورپس مورد استفاده برای آموزش کلمه جا افتاده معرفی شده است.

نتیجه گیری: اگرچه دقت روش شرح داده شده در اینجا به اندازه کافی کم است که هنوز هم نیاز به بررسی انسان از هر لیست مدت نامزد تولید شده در چنین روشی، این واقعیت است که این فرایند قادر به تشخیص 30 شرایط جدید برای ماده هدف تنها بر اساس ارزش یک ماه از داده های توییتر بسیار امیدوار کننده است. ما این مطالعه خلبانی را به عنوان یک اثبات مهم مفهوم و اولین گام به سوی تولید یک سیستم کشف مدت مواد مخدر کاملا خودکار قادر به ردیابی شرایط در حال ظهور NPS در زمان واقعی می بینیم.