تجزیه و تحلیل احساسات (همچنین به عنوان عقیده کاوی یا هوش مصنوعی احساسات شناخته می شود ) استفاده از پردازش زبان طبیعی ، تجزیه و تحلیل متن ، زبان شناسی محاسباتی و بیومتریک برای شناسایی، استخراج، کمی سازی و مطالعه حالت های عاطفی و اطلاعات ذهنی است. تجزیه و تحلیل احساسات به طور گسترده برای صدای مطالب مشتری مانند بررسی ها و پاسخ های نظرسنجی، رسانه های آنلاین و اجتماعی، و مواد مراقبت های بهداشتی برای برنامه هایی که از بازاریابی گرفته تا خدمات مشتری و پزشکی بالینی را شامل می شود، اعمال می شود. با ظهور مدلهای زبان عمیق، مانند RoBERTa ، میتوان حوزههای دادهای دشوارتر را نیز تحلیل کرد، بهعنوان مثال، متون خبری که در آن نویسندگان معمولاً نظر/احساسات خود را کمتر صریح بیان میکنند. [1]
یک وظیفه اساسی در تجزیه و تحلیل احساسات، طبقه بندی قطبیت یک متن معین در سطح سند، جمله، یا ویژگی/جنبه است – چه نظر بیان شده در یک سند، یک جمله یا یک ویژگی/جنبه موجودیت مثبت، منفی یا خنثی باشد. طبقهبندی پیشرفته احساسات «فراتر از قطبیت» به عنوان مثال به حالتهای احساسی مانند لذت، خشم، انزجار، غم، ترس و تعجب میپردازد. [2]
پیشروهای تحلیل احساسات شامل پرسشگر عمومی [3] است که نکاتی را برای کمی کردن الگوها در متن ارائه میدهد و بهطور جداگانه، تحقیقات روانشناختی که وضعیت روانشناختی افراد را بر اساس تحلیل رفتار کلامی آنها بررسی میکرد. [4]
متعاقباً، روشی که در پتنتی توسط Volcani و Fogel [5] توضیح داده شد، به طور خاص به احساسات نگاه کرد و کلمات و عبارات فردی را در متن با توجه به مقیاسهای احساسی مختلف شناسایی کرد. یک سیستم فعلی بر اساس کار آنها، به نام EffectCheck، مترادف هایی را ارائه می دهد که می توانند برای افزایش یا کاهش سطح احساسات برانگیخته در هر مقیاس استفاده شوند.
بسیاری از تلاشهای بعدی دیگر با استفاده از یک دیدگاه قطبی صرف از احساسات، از مثبت به منفی، کمتر پیچیده بودند، مانند کارهای Turney، [6] و Pang [7] که به ترتیب روشهای مختلفی را برای تشخیص قطبیت نقد محصول و نقد فیلم به کار بردند. . این کار در سطح سند است. همچنین می توان قطبیت یک سند را در مقیاس چند جهته طبقه بندی کرد که توسط پانگ [8] و اسنایدر [9] در میان دیگران انجام شد: پانگ و لی [8] وظیفه اصلی طبقه بندی یک نقد فیلم را به عنوان مثبت یا منفی گسترش دادند. برای پیشبینی رتبهبندی ستارهها در مقیاس 3 یا 4 ستاره، در حالی که اسنایدر [9] تجزیه و تحلیل عمیقی از بررسیهای رستوران انجام داد، و رتبهبندیها را برای جنبههای مختلف رستوران داده شده، مانند غذا و جو (در یک مقیاس پنج ستاره).
اولین گام ها برای گرد هم آوردن رویکردهای مختلف - یادگیری، واژگانی، مبتنی بر دانش، و غیره - در سمپوزیوم بهار AAAI در سال 2004 برداشته شد که در آن زبان شناسان، دانشمندان کامپیوتر و سایر محققان علاقه مند ابتدا علایق را همسو کردند و وظایف مشترک و مجموعه داده های معیار را برای تحقیقات محاسباتی سیستماتیک در مورد عاطفه، جذابیت، ذهنیت و احساسات در متن. [10]
حتی اگر در اکثر روشهای طبقهبندی آماری، کلاس خنثی با این فرض که متون خنثی در نزدیکی مرز طبقهبندیکننده باینری قرار دارند نادیده گرفته میشود، چندین محقق پیشنهاد میکنند که مانند هر مسئله قطبیت، سه دسته باید شناسایی شوند. علاوه بر این، می توان ثابت کرد که طبقه بندی کننده های خاصی مانند Max Entropy [11] و SVMs [12] می توانند از معرفی یک کلاس خنثی بهره مند شوند و دقت کلی طبقه بندی را بهبود بخشند. اصولاً دو راه برای کار با کلاس خنثی وجود دارد. یا، الگوریتم ابتدا با شناسایی زبان خنثی، فیلتر کردن آن و سپس ارزیابی بقیه از نظر احساسات مثبت و منفی پیش میرود، یا در یک مرحله یک طبقهبندی سهطرفه ایجاد میکند. [13] این رویکرد دوم اغلب شامل تخمین توزیع احتمال بر روی همه دستهها است (مثلاً طبقهبندیکنندههای ساده بیز که توسط NLTK پیادهسازی شدهاند ). اینکه آیا و چگونه از یک کلاس خنثی استفاده کنیم به ماهیت داده ها بستگی دارد: اگر داده ها به وضوح به زبان های خنثی، منفی و مثبت خوشه بندی شوند، منطقی است که زبان خنثی را فیلتر کنیم و بر قطبیت بین احساسات مثبت و منفی تمرکز کنیم. در مقابل، اگر داده ها عمدتاً خنثی با انحرافات کوچک به سمت تأثیر مثبت و منفی باشند، این استراتژی تشخیص واضح بین دو قطب را دشوارتر می کند.
یک روش متفاوت برای تعیین احساسات، استفاده از یک سیستم مقیاسبندی است که به موجب آن به کلماتی که معمولاً با داشتن احساسات منفی، خنثی یا مثبت مرتبط هستند، یک عدد مرتبط در مقیاس 10- تا 10+ (از منفیترین تا مثبتترین) یا به سادگی داده میشود. از 0 تا حد بالایی مثبت مانند +4. این امکان تنظیم احساس یک اصطلاح معین را نسبت به محیط آن (معمولاً در سطح جمله) فراهم می کند. هنگامی که یک قطعه از متن بدون ساختار با استفاده از پردازش زبان طبیعی تجزیه و تحلیل می شود ، به هر مفهوم در محیط مشخص شده امتیازی بر اساس نحوه ارتباط کلمات احساسی با مفهوم و امتیاز مرتبط با آن داده می شود. [14] [15] این امکان حرکت به سمت درک پیچیدهتری از احساسات را میدهد، زیرا اکنون میتوان ارزش احساسی یک مفهوم را نسبت به تغییراتی که ممکن است آن را احاطه کرده است تنظیم کرد. به عنوان مثال، کلماتی که احساسات بیان شده توسط این مفهوم را تشدید، آرام می کنند یا نفی می کنند، می توانند بر امتیاز آن تأثیر بگذارند. از طرف دیگر، اگر هدف تعیین احساسات در متن باشد به جای قطبیت و قدرت کلی متن، میتوان به متون نمره قوت احساسات مثبت و منفی داد. [16]
انواع مختلفی از تجزیه و تحلیل احساسات وجود دارد، مانند تجزیه و تحلیل احساسات مبتنی بر جنبه، تجزیه و تحلیل احساسات درجه بندی (مثبت، منفی، خنثی)، تجزیه و تحلیل احساسات چند زبانه و تشخیص احساسات.
این وظیفه معمولاً به عنوان طبقه بندی یک متن معین (معمولاً یک جمله) به یکی از دو کلاس: عینی یا ذهنی تعریف می شود. [17] این مشکل گاهی اوقات می تواند دشوارتر از طبقه بندی قطبی باشد. [18] ذهنی بودن کلمات و عبارات ممکن است به بافت آنها بستگی داشته باشد و یک سند عینی ممکن است حاوی جملات ذهنی باشد (مثلاً، یک مقاله خبری به نقل از نظرات مردم). علاوه بر این، همانطور که توسط سو ذکر شد، [19] نتایج تا حد زیادی به تعریف ذهنیت مورد استفاده در هنگام حاشیه نویسی متون وابسته است. با این حال، Pang [20] نشان داد که حذف جملات عینی از یک سند قبل از طبقه بندی قطبیت آن به بهبود عملکرد کمک می کند.
شناسایی ذهنی و عینی، وظایف فرعی در حال ظهور تجزیه و تحلیل احساسات برای استفاده از ویژگیهای نحوی، معنایی و دانش یادگیری ماشینی برای تشخیص اینکه آیا یک جمله یا سند حاوی حقایق یا نظرات است یا خیر. آگاهی از شناخت واقعیات و نظرات اخیر نیست، احتمالاً برای اولین بار توسط Carbonell در دانشگاه Yale در سال 1979 ارائه شده است .
اصطلاح هدف به حادثه ای اشاره دارد که حاوی اطلاعات واقعی است. [21]
اصطلاح ذهنی این حادثه را توصیف میکند که حاوی اطلاعات غیر واقعی به اشکال مختلف است، مانند نظرات شخصی، قضاوت و پیشبینیها، همچنین به عنوان «ایالتهای خصوصی» شناخته میشوند. [22] در مثال زیر، یک ایالت خصوصی "ما آمریکایی ها" را منعکس می کند. علاوه بر این، نهاد هدف اظهار نظر شده توسط نظرات می تواند به اشکال مختلفی از محصول ملموس تا موضوعات ناملموس بیان شده در لیو (2010) باشد. [23] علاوه بر این، سه نوع نگرش توسط لیو (2010) مشاهده شد، 1) نظرات مثبت، 2) نظرات خنثی، و 3) نظرات منفی. [23]
این تحلیل یک مشکل طبقه بندی است. [24]
مجموعه کلمات یا نشانگرهای عبارات هر کلاس برای مکان یابی الگوهای مطلوب در متن بدون حاشیه تعریف شده است. برای بیان ذهنی، فهرست کلمات متفاوتی ایجاد شده است. فهرستهایی از شاخصهای ذهنی در کلمات یا عبارات توسط چندین محقق در زمینههای زبانشناس و پردازش زبان طبیعی در Riloff و همکاران ایجاد شده است. (2003). [25] یک فرهنگ لغت از قوانین استخراج باید برای اندازه گیری عبارات داده شده ایجاد شود. در طی سالها، در تشخیص ذهنی، پیشرفت استخراج ویژگیها از تنظیم ویژگیها با دست به یادگیری ویژگیهای خودکار میرود. در حال حاضر، روشهای یادگیری خودکار میتوانند به یادگیری ماشینی نظارتشده و بدون نظارت تقسیم شوند . استخراج الگوها با فرآیند یادگیری ماشینی مشروح و بدون حاشیه به طور گسترده توسط محققان دانشگاهی مورد بررسی قرار گرفته است.
با این حال، محققان چندین چالش را در ایجاد مجموعههای ثابتی از قوانین برای عبارات تشخیص دادند. بسیاری از چالش ها در توسعه قوانین از ماهیت اطلاعات متنی ناشی می شود. شش چالش توسط چندین محقق تشخیص داده شده است: 1) عبارات استعاری، 2) اختلاف در نوشته ها، 3) حساس به بافت، 4) نمایش کلمات با کاربردهای کمتر، 5) حساس به زمان، و 6) حجم در حال رشد.
پیش از این، تحقیقات عمدتاً بر طبقه بندی سطح اسناد متمرکز بود. با این حال، طبقه بندی یک سطح سند از دقت کمتری برخوردار است، زیرا یک مقاله ممکن است دارای انواع مختلفی از عبارات باشد. شواهد پژوهشی مجموعهای از مقالات خبری را نشان میدهد که انتظار میرود بیان عینی بر آنها غالب باشد، در حالی که نتایج نشان میدهد که بیش از 40 درصد بیان ذهنی را شامل میشود. [21]
برای غلبه بر این چالش ها، محققان به این نتیجه می رسند که کارایی طبقه بندی کننده به دقت الگوهای یادگیرنده بستگی دارد. و فیدهای یادگیرنده با حجم زیادی از دادههای آموزشی مشروح، بهتر از آنهایی است که با ویژگیهای ذهنی کمتر جامع آموزش دیدهاند. با این حال، یکی از موانع اصلی برای اجرای این نوع کار، تولید مجموعه داده بزرگی از جملات مشروح به صورت دستی است. روش حاشیه نویسی دستی به سه دلیل کمتر از یادگیری خودکار مورد توجه قرار گرفته است:
همه این دلایل ذکر شده می تواند بر کارایی و اثربخشی طبقه بندی ذهنی و عینی تأثیر بگذارد. بر این اساس، دو روش راهاندازی برای یادگیری الگوهای زبانی از دادههای متنی بدون حاشیهنویسی طراحی شد. هر دو روش با تعداد انگشت شماری از کلمات اولیه و داده های متنی بدون حاشیه شروع می شوند.
به طور کلی، این الگوریتمها نیاز به تشخیص و استخراج خودکار الگو را در کار ذهنی و عینی برجسته میکنند.
طبقه بندی کننده موضوعی و شی می تواند چندین کاربرد پردازش زبان طبیعی را افزایش دهد. یکی از مزایای اصلی طبقهبندیکننده این است که فرآیندهای تصمیمگیری مبتنی بر داده را در صنایع مختلف رواج داد. به گفته لیو، کاربردهای شناسایی ذهنی و عینی در تجارت، تبلیغات، ورزش و علوم اجتماعی اجرا شده است. [30]
این به تعیین نظرات یا احساسات بیان شده در مورد ویژگی ها یا جنبه های مختلف موجودیت ها، به عنوان مثال، یک تلفن همراه، یک دوربین دیجیتال، یا یک بانک اشاره دارد. [35] یک ویژگی یا جنبه یک ویژگی یا جزء یک موجودیت است، به عنوان مثال، صفحه نمایش تلفن همراه، خدمات یک رستوران، یا کیفیت تصویر یک دوربین. مزیت تجزیه و تحلیل احساسات مبتنی بر ویژگی، امکان گرفتن نکات ظریف در مورد اشیاء مورد علاقه است. ویژگیهای مختلف میتوانند واکنشهای احساسات متفاوتی ایجاد کنند، برای مثال یک هتل میتواند موقعیت مناسبی داشته باشد، اما غذای متوسطی داشته باشد. [36] این مشکل شامل چندین مشکل فرعی است، به عنوان مثال، شناسایی نهادهای مرتبط، استخراج ویژگیها/جنبههای آنها، و تعیین اینکه آیا نظر ابراز شده در مورد هر ویژگی/جنبه مثبت، منفی یا خنثی است. [37] شناسایی خودکار ویژگیها را میتوان با روشهای نحوی، با مدلسازی موضوعی ، [38] [39] یا با یادگیری عمیق انجام داد . [40] [41] بحث های دقیق تر در مورد این سطح از تحلیل احساسات را می توان در کار لیو یافت. [23]
عواطف و احساسات ماهیت ذهنی دارند. میزان احساسات/احساسات بیان شده در متن معین در سطح سند، جمله، یا ویژگی/جنبه - میزان شدتی که در نظر یک سند، یک جمله یا یک موجود بیان میشود ، در هر مورد متفاوت است. اساس [42] با این حال، پیشبینی تنها عواطف و احساسات همیشه اطلاعات کاملی را منتقل نمیکند. درجه یا سطح احساسات و عواطف اغلب نقش مهمی در درک احساس دقیق در یک کلاس دارد (به عنوان مثال، "خوب" در مقابل "عالی"). برخی از روشها از یک روش مجموعهای انباشته [43] برای پیشبینی شدت عواطف و احساسات با ترکیب خروجیهای بهدستآمده و استفاده از مدلهای یادگیری عمیق مبتنی بر شبکههای عصبی کانولوشنال ، [44] شبکههای حافظه کوتاهمدت و واحدهای بازگشتی دروازهدار استفاده میکنند . [45]
رویکردهای موجود برای تحلیل احساسات را می توان به سه دسته اصلی دسته بندی کرد: تکنیک های مبتنی بر دانش، روش های آماری و رویکردهای ترکیبی. [46] تکنیکهای دانشمحور، متن را بر اساس دستههای تأثیرگذار بر اساس وجود کلمات تأثیرگذار بدون ابهام مانند شاد، غمگین، ترس، و ملال طبقهبندی میکنند. [47] برخی از پایگاههای دانش نهتنها کلمات تأثیرگذار آشکار را فهرست میکنند، بلکه واژههای دلخواه را «قرابت» احتمالی با احساسات خاص تعیین میکنند. [48] روشهای آماری از عناصر یادگیری ماشینی مانند تحلیل معنایی پنهان ، ماشینهای برداری پشتیبانی ، " کیف کلمات "، " اطلاعات متقابل نقطهای " برای جهتگیری معنایی، [6] مدلهای فضای معنایی یا مدلهای جاسازی کلمه ، [49] و یادگیری عمیق . روشهای پیچیدهتر سعی میکنند دارنده یک احساس (یعنی شخصی که آن حالت عاطفی را حفظ میکند) و هدف (یعنی موجودی که تأثیر در مورد آن احساس میشود) را شناسایی کنند. [50] برای استخراج نظر در زمینه و دریافت ویژگی که گوینده در مورد آن نظر داشته است، از روابط دستوری کلمات استفاده می شود. روابط وابستگی گرامری با تجزیه عمیق متن به دست می آید. [51] رویکردهای ترکیبی هم از یادگیری ماشین و هم عناصری از بازنمایی دانش مانند هستی شناسی ها و شبکه های معنایی استفاده می کنند تا معنایی را که به شیوه ای ظریف بیان می شوند، شناسایی کنند، به عنوان مثال، از طریق تجزیه و تحلیل مفاهیمی که به صراحت اطلاعات مرتبط را منتقل نمی کنند، اما به طور ضمنی با مفاهیم دیگری که این کار را انجام می دهند مرتبط هستند. [52]
ابزارهای نرمافزار متنباز و همچنین طیف وسیعی از ابزارهای رایگان و پولی تجزیه و تحلیل احساسات ، تکنیکهای یادگیری ماشین ، آمار و پردازش زبان طبیعی را برای خودکارسازی تحلیل احساسات در مجموعههای بزرگی از متون، از جمله صفحات وب، اخبار آنلاین، گروههای بحث اینترنتی، بررسیهای آنلاین، به کار میگیرند. وبلاگ های وب و رسانه های اجتماعی [53] از سوی دیگر، سیستمهای مبتنی بر دانش، از منابع در دسترس عموم برای استخراج اطلاعات معنایی و عاطفی مرتبط با مفاهیم زبان طبیعی استفاده میکنند. این سیستم می تواند به اجرای استدلال عاطفی عاطفی کمک کند . [54] تجزیه و تحلیل احساسات همچنین می تواند بر روی محتوای بصری، به عنوان مثال، تصاویر و ویدئوها انجام شود (به تجزیه و تحلیل احساسات چندوجهی مراجعه کنید ). یکی از اولین رویکردها در این راستا، SentiBank [55] با استفاده از نمایش جفت اسم صفت از محتوای بصری است. علاوه بر این، اکثریت قریب به اتفاق رویکردهای طبقهبندی احساسات بر مدل کیسهای از کلمات تکیه میکنند، که متن، دستور زبان و حتی ترتیب کلمات را نادیده میگیرد . رویکردهایی که احساسات را بر اساس چگونگی ترکیب کلمات به معنای عبارات بلندتر تجزیه و تحلیل میکنند، نتیجه بهتری را نشان دادهاند، [56] اما حاشیهنویسی اضافی را به همراه دارند.
یک جزء تجزیه و تحلیل انسانی در تجزیه و تحلیل احساسات مورد نیاز است، زیرا سیستم های خودکار قادر به تجزیه و تحلیل گرایش های تاریخی یک نظر دهنده یا پلت فرم نیستند و اغلب در احساسات ابراز شده آنها به اشتباه طبقه بندی می شوند. اتوماسیون تقریباً بر 23٪ نظراتی که به درستی توسط انسان طبقه بندی شده اند تأثیر می گذارد. [57] با این حال، انسانها اغلب مخالف هستند، و استدلال میشود که توافق بینانسانی یک حد بالایی را فراهم میکند که طبقهبندیکنندههای احساسات خودکار در نهایت میتوانند به آن دست یابند. [58]
دقت سیستم تجزیه و تحلیل احساسات، اصولاً این است که چقدر با قضاوت های انسانی مطابقت دارد. این معمولاً با معیارهای متغیر مبتنی بر دقت و یادآوری در دو دسته هدف متون منفی و مثبت اندازهگیری میشود . با این حال، طبق تحقیقات، ارزیابهای انسانی معمولاً فقط در مورد 80٪ [59] مواقع موافق هستند (به قابلیت اطمینان بین رتبهبندی مراجعه کنید ). بنابراین، برنامهای که به دقت ۷۰ درصد در طبقهبندی احساسات دست مییابد، تقریباً به خوبی انسان عمل میکند، حتی اگر چنین دقتی چشمگیر به نظر نرسد. اگر یک برنامه در 100٪ موارد "درست" بود، انسان ها هنوز هم در 20٪ موارد با آن مخالف بودند، زیرا آنها در مورد هر پاسخی تا این حد مخالف هستند. [ نیازمند منبع ]
از سوی دیگر، سیستم های کامپیوتری خطاهای بسیار متفاوتی نسبت به ارزیاب های انسانی خواهند داشت و بنابراین ارقام کاملاً قابل مقایسه نیستند. به عنوان مثال، یک سیستم کامپیوتری با نفی، اغراق، شوخی یا طعنه مشکل دارد ، که معمولا برای یک خواننده انسانی قابل کنترل است: برخی از خطاهایی که یک سیستم کامپیوتری مرتکب می شود برای انسان بیش از حد ساده به نظر می رسد. به طور کلی، سودمندی برای وظایف تجاری عملی تحلیل احساسات همانطور که در تحقیقات آکادمیک تعریف شده است زیر سوال رفته است، زیرا مدل ساده یک بعدی احساسات از منفی به مثبت اطلاعات عملی کمی را برای مشتری که نگران تأثیر گفتمان عمومی بر شهرت برند یا شرکت. [60] [61] [62]
برای تناسب بهتر با نیازهای بازار، ارزیابی تحلیل احساسات به سمت اقدامات مبتنی بر وظیفه بیشتر همراه با نمایندگان آژانس های روابط عمومی و متخصصان تحقیقات بازار تدوین شده است. تمرکز در مجموعه داده های ارزیابی RepLab کمتر بر محتوای متن مورد بررسی است و بیشتر بر تأثیر متن مورد نظر بر شهرت برند است . [63] [64] [65]
از آنجایی که ارزیابی تجزیه و تحلیل احساسات روز به روز بیشتر مبتنی بر وظیفه می شود، هر پیاده سازی به یک مدل آموزشی جداگانه نیاز دارد تا نمایش دقیق تری از احساسات برای یک مجموعه داده معین به دست آورد.
ظهور رسانه های اجتماعی مانند وبلاگ ها و شبکه های اجتماعی علاقه به تجزیه و تحلیل احساسات را افزایش داده است. با گسترش بررسی ها، رتبه بندی ها، توصیه ها و سایر اشکال بیان آنلاین، نظرات آنلاین به نوعی ارز مجازی برای مشاغلی تبدیل شده است که به دنبال بازاریابی محصولات خود، شناسایی فرصت های جدید و مدیریت شهرت خود هستند. از آنجایی که کسبوکارها به دنبال خودکار کردن فرآیند فیلتر کردن نویز، درک مکالمات، شناسایی محتوای مرتبط و انجام مناسب آن هستند، اکنون بسیاری به دنبال حوزه تحلیل احساسات هستند. [66] پیچیده تر این موضوع، ظهور پلتفرم های رسانه های اجتماعی ناشناس مانند 4chan و Reddit است . [67] اگر وب 2.0 تماماً در مورد دموکراتیزه کردن انتشار بود، مرحله بعدی وب ممکن است مبتنی بر دموکراتیزه کردن داده کاوی تمام محتوایی باشد که منتشر می شود. [68]
یک گام به سوی این هدف در تحقیق انجام می شود. چندین تیم تحقیقاتی در دانشگاه های سراسر جهان در حال حاضر بر درک پویایی احساسات در جوامع الکترونیکی از طریق تجزیه و تحلیل احساسات تمرکز می کنند. [69]
مشکل این است که اکثر الگوریتمهای تحلیل احساسات از عبارات ساده برای بیان احساسات در مورد یک محصول یا خدمات استفاده میکنند. با این حال، عوامل فرهنگی، تفاوتهای زبانی، و زمینههای متفاوت تبدیل یک رشته متن نوشته شده به یک طرفدار یا موافق ساده را بسیار دشوار میکند. [66] این واقعیت که انسانها اغلب در مورد احساس متن با هم اختلاف نظر دارند، نشان میدهد که چقدر کار بزرگی برای رایانههاست که این کار را درست انجام دهند. هرچه رشته متن کوتاه تر باشد، سخت تر می شود.
حتی اگر رشته های متن کوتاه ممکن است یک مشکل باشد، تجزیه و تحلیل احساسات در میکروبلاگینگ نشان داده است که توییتر می تواند به عنوان یک شاخص آنلاین معتبر از احساسات سیاسی دیده شود. احساسات سیاسی توییتها نشاندهنده مکاتبات نزدیک با مواضع سیاسی احزاب و سیاستمداران است، که نشان میدهد محتوای پیامهای توییتر به طور قابل قبولی منعکسکننده چشمانداز سیاسی آفلاین است. [70] علاوه بر این، تجزیه و تحلیل احساسات در توییتر نیز نشان داده شده است که خلق و خوی عمومی را در پشت چرخههای تولید مثل انسان در سطح جهانی، [71] و همچنین سایر مشکلات مربوط به سلامت عمومی مانند واکنشهای نامطلوب دارویی را نشان میدهد. [72]
در حالی که تجزیه و تحلیل احساسات برای حوزههایی که نویسندگان نظر خود را نسبتاً صریح بیان میکنند ("فیلم فوقالعاده است") مانند رسانههای اجتماعی و بررسی محصول محبوب بوده است، اخیراً روشهای قوی برای سایر حوزههایی که احساسات به شدت ضمنی یا غیرمستقیم است ابداع شده است. به عنوان مثال، در مقالات خبری - بیشتر به دلیل عینیت روزنامه نگاری مورد انتظار - روزنامه نگاران اغلب اعمال یا رویدادها را به جای بیان مستقیم قطبیت یک قطعه اطلاعات توصیف می کنند. رویکردهای قبلی با استفاده از لغت نامه ها یا ویژگی های کم عمق یادگیری ماشین قادر به درک "معنای بین خطوط" نبودند، اما اخیرا محققان یک رویکرد مبتنی بر یادگیری عمیق و مجموعه داده ای را پیشنهاد کرده اند که قادر به تجزیه و تحلیل احساسات در مقالات خبری است. [1]
محققان از تجزیه و تحلیل احساسات برای تجزیه و تحلیل توییت های ایمنی و بهداشت ساخت و ساز (که اکنون X نامیده می شود) استفاده کرده اند. این تحقیق نشان داد که بین علاقه مندی ها و ریتوییت ها از نظر ظرفیت احساسات همبستگی مثبت وجود دارد. دیگران تأثیر YouTube بر انتشار دانش ایمنی و بهداشت ساخت و ساز را بررسی کرده اند. آنها از طریق تحلیل معنایی بررسی کردند که چگونه احساسات بر رفتارهای کاربران از نظر مشاهده و اظهار نظر تأثیر می گذارد. در مطالعه دیگری، احساسات مثبت 85 درصد در اشتراک دانش ایمنی و سلامت ساخت و ساز از طریق اینستاگرام را به خود اختصاص داده است. [73]
برای یک سیستم توصیهگر ، تحلیل احساسات یک تکنیک ارزشمند است. هدف یک سیستم توصیهگر پیشبینی اولویت برای یک مورد از یک کاربر هدف است. سیستم های توصیه گر اصلی بر روی مجموعه داده های صریح کار می کنند. به عنوان مثال، فیلتر مشارکتی روی ماتریس رتبهبندی کار میکند و فیلتر مبتنی بر محتوا روی متا دادههای آیتمها کار میکند.
در بسیاری از سرویسهای شبکههای اجتماعی یا وبسایتهای تجارت الکترونیک ، کاربران میتوانند بررسی متنی، نظر یا بازخوردی برای موارد ارائه دهند. این متنهای تولید شده توسط کاربر منبعی غنی از نظرات احساسی کاربر در مورد محصولات و اقلام متعدد است. به طور بالقوه، برای یک آیتم، چنین متنی می تواند هم ویژگی/جنبه های مرتبط مورد و هم احساسات کاربران را در مورد هر ویژگی نشان دهد. [74] ویژگی/جنبه های مورد توضیح داده شده در متن همان نقش را با متا داده ها در فیلترینگ مبتنی بر محتوا ایفا می کند ، اما اولی برای سیستم توصیه گر ارزشمندتر است. از آنجایی که این ویژگیها به طور گسترده توسط کاربران در بررسیهای خود ذکر میشوند، میتوان آنها را بهعنوان مهمترین ویژگیهایی دانست که میتوانند بهطور قابلتوجهی بر تجربه کاربر در مورد کالا تأثیر بگذارند، در حالی که متا دادههای مورد (معمولاً توسط تولیدکنندگان بهجای مصرفکنندگان ارائه میشود) ممکن است ویژگی هایی را که مورد توجه کاربران است نادیده بگیرد. برای آیتم های مختلف با ویژگی های مشترک، یک کاربر ممکن است احساسات متفاوتی ارائه دهد. همچنین، یک ویژگی از یک مورد ممکن است احساسات متفاوتی را از کاربران مختلف دریافت کند. احساسات کاربران در مورد ویژگی ها را می توان به عنوان یک امتیاز رتبه بندی چند بعدی در نظر گرفت که نشان دهنده ترجیح آنها در مورد موارد است.
بر اساس ویژگی/جنبه ها و احساسات استخراج شده از متن تولید شده توسط کاربر، می توان یک سیستم توصیه گر ترکیبی ساخت. [75] دو نوع انگیزه برای توصیه یک مورد نامزد به کاربر وجود دارد. انگیزه اول این است که آیتم کاندید دارای ویژگی های مشترک متعدد با آیتم های ترجیحی کاربر است، [76] در حالی که انگیزه دوم این است که مورد کاندید احساس بالایی نسبت به ویژگی های خود دریافت می کند. برای یک آیتم ترجیحی، منطقی است که باور کنیم اقلام با ویژگیهای یکسان عملکرد یا کاربرد مشابهی دارند. بنابراین، این موارد نیز احتمالاً توسط کاربر ترجیح داده می شود. از سوی دیگر، برای ویژگی مشترک دو مورد کاندید، کاربران دیگر ممکن است به یکی از آنها احساسات مثبت بدهند در حالی که به دیگری احساسات منفی بدهند. واضح است که آیتم با ارزیابی بالا باید به کاربر توصیه شود. بر اساس این دو انگیزه، یک امتیاز رتبه بندی ترکیبی از شباهت و رتبه بندی احساسات می تواند برای هر مورد نامزد ایجاد شود. [75]
به جز دشواری خود تجزیه و تحلیل احساسات، اعمال تجزیه و تحلیل احساسات بر روی نظرات یا بازخوردها نیز با چالش هرزنامه ها و بررسی های جانبدارانه مواجه است. یک جهت کار بر ارزیابی مفید بودن هر مرور متمرکز است. [77] بررسی یا بازخورد بد نوشته شده به سختی برای سیستم توصیهکننده مفید است. علاوه بر این، یک بررسی می تواند برای جلوگیری از فروش یک محصول هدف طراحی شود، بنابراین حتی اگر به خوبی نوشته شده باشد، برای سیستم توصیه کننده مضر باشد.
محققان همچنین دریافتند که فرم های طولانی و کوتاه متن تولید شده توسط کاربر باید به گونه ای متفاوت برخورد شود. یک نتیجه جالب نشان می دهد که مرورهای کوتاه گاهی اوقات مفیدتر از فرم طولانی هستند، [78] زیرا فیلتر کردن نویز در یک متن کوتاه ساده تر است. برای متن طولانی، افزایش طول متن همیشه باعث افزایش متناسب در تعداد ویژگیها یا احساسات متن نمیشود.
Lamba & Madhusudhan [79] با بستهبندی مجدد نتایج حاصل از تحلیل احساسات پلتفرمهای رسانههای اجتماعی مانند توییتر و ارائه آن به عنوان یک سرویس مبتنی بر زمان تلفیقی در قالبهای مختلف، راه جدیدی را برای تأمین نیازهای اطلاعاتی کاربران امروزی کتابخانه معرفی میکنند. علاوه بر این، آنها روش جدیدی را برای انجام بازاریابی در کتابخانه ها با استفاده از کاوی رسانه های اجتماعی و تحلیل احساسات پیشنهاد می کنند.