stringtranslate.com

تحلیل احساسات

تجزیه و تحلیل احساسات (همچنین به عنوان عقیده کاوی یا هوش مصنوعی احساسات شناخته می شود ) استفاده از پردازش زبان طبیعی ، تجزیه و تحلیل متن ، زبان شناسی محاسباتی و بیومتریک برای شناسایی، استخراج، کمی سازی و مطالعه حالت های عاطفی و اطلاعات ذهنی است. تجزیه و تحلیل احساسات به طور گسترده برای صدای مطالب مشتری مانند بررسی ها و پاسخ های نظرسنجی، رسانه های آنلاین و اجتماعی، و مواد مراقبت های بهداشتی برای برنامه هایی که از بازاریابی گرفته تا خدمات مشتری و پزشکی بالینی را شامل می شود، اعمال می شود. با ظهور مدل‌های زبان عمیق، مانند RoBERTa ، می‌توان حوزه‌های داده‌ای دشوارتر را نیز تحلیل کرد، به‌عنوان مثال، متون خبری که در آن نویسندگان معمولاً نظر/احساسات خود را کمتر صریح بیان می‌کنند. [1]

موارد ساده

نمونه های چالش برانگیزتر

انواع

یک وظیفه اساسی در تجزیه و تحلیل احساسات، طبقه بندی قطبیت یک متن معین در سطح سند، جمله، یا ویژگی/جنبه است – چه نظر بیان شده در یک سند، یک جمله یا یک ویژگی/جنبه موجودیت مثبت، منفی یا خنثی باشد. طبقه‌بندی پیشرفته احساسات «فراتر از قطبیت» به عنوان مثال به حالت‌های احساسی مانند لذت، خشم، انزجار، غم، ترس و تعجب می‌پردازد. [2]

پیشروهای تحلیل احساسات شامل پرسشگر عمومی [3] است که نکاتی را برای کمی کردن الگوها در متن ارائه می‌دهد و به‌طور جداگانه، تحقیقات روان‌شناختی که وضعیت روان‌شناختی افراد را بر اساس تحلیل رفتار کلامی آن‌ها بررسی می‌کرد. [4]

متعاقباً، روشی که در پتنتی توسط Volcani و Fogel [5] توضیح داده شد، به طور خاص به احساسات نگاه کرد و کلمات و عبارات فردی را در متن با توجه به مقیاس‌های احساسی مختلف شناسایی کرد. یک سیستم فعلی بر اساس کار آنها، به نام EffectCheck، مترادف هایی را ارائه می دهد که می توانند برای افزایش یا کاهش سطح احساسات برانگیخته در هر مقیاس استفاده شوند.

بسیاری از تلاش‌های بعدی دیگر با استفاده از یک دیدگاه قطبی صرف از احساسات، از مثبت به منفی، کمتر پیچیده بودند، مانند کارهای Turney، [6] و Pang [7] که به ترتیب روش‌های مختلفی را برای تشخیص قطبیت نقد محصول و نقد فیلم به کار بردند. . این کار در سطح سند است. همچنین می توان قطبیت یک سند را در مقیاس چند جهته طبقه بندی کرد که توسط پانگ [8] و اسنایدر [9] در میان دیگران انجام شد: پانگ و لی [8] وظیفه اصلی طبقه بندی یک نقد فیلم را به عنوان مثبت یا منفی گسترش دادند. برای پیش‌بینی رتبه‌بندی ستاره‌ها در مقیاس 3 یا 4 ستاره، در حالی که اسنایدر [9] تجزیه و تحلیل عمیقی از بررسی‌های رستوران انجام داد، و رتبه‌بندی‌ها را برای جنبه‌های مختلف رستوران داده شده، مانند غذا و جو (در یک مقیاس پنج ستاره).

اولین گام ها برای گرد هم آوردن رویکردهای مختلف - یادگیری، واژگانی، مبتنی بر دانش، و غیره - در سمپوزیوم بهار AAAI در سال 2004 برداشته شد که در آن زبان شناسان، دانشمندان کامپیوتر و سایر محققان علاقه مند ابتدا علایق را همسو کردند و وظایف مشترک و مجموعه داده های معیار را برای تحقیقات محاسباتی سیستماتیک در مورد عاطفه، جذابیت، ذهنیت و احساسات در متن. [10]

حتی اگر در اکثر روش‌های طبقه‌بندی آماری، کلاس خنثی با این فرض که متون خنثی در نزدیکی مرز طبقه‌بندی‌کننده باینری قرار دارند نادیده گرفته می‌شود، چندین محقق پیشنهاد می‌کنند که مانند هر مسئله قطبیت، سه دسته باید شناسایی شوند. علاوه بر این، می توان ثابت کرد که طبقه بندی کننده های خاصی مانند Max Entropy [11] و SVMs [12] می توانند از معرفی یک کلاس خنثی بهره مند شوند و دقت کلی طبقه بندی را بهبود بخشند. اصولاً دو راه برای کار با کلاس خنثی وجود دارد. یا، الگوریتم ابتدا با شناسایی زبان خنثی، فیلتر کردن آن و سپس ارزیابی بقیه از نظر احساسات مثبت و منفی پیش می‌رود، یا در یک مرحله یک طبقه‌بندی سه‌طرفه ایجاد می‌کند. [13] این رویکرد دوم اغلب شامل تخمین توزیع احتمال بر روی همه دسته‌ها است (مثلاً طبقه‌بندی‌کننده‌های ساده بیز که توسط NLTK پیاده‌سازی شده‌اند ). اینکه آیا و چگونه از یک کلاس خنثی استفاده کنیم به ماهیت داده ها بستگی دارد: اگر داده ها به وضوح به زبان های خنثی، منفی و مثبت خوشه بندی شوند، منطقی است که زبان خنثی را فیلتر کنیم و بر قطبیت بین احساسات مثبت و منفی تمرکز کنیم. در مقابل، اگر داده ها عمدتاً خنثی با انحرافات کوچک به سمت تأثیر مثبت و منفی باشند، این استراتژی تشخیص واضح بین دو قطب را دشوارتر می کند.

یک روش متفاوت برای تعیین احساسات، استفاده از یک سیستم مقیاس‌بندی است که به موجب آن به کلماتی که معمولاً با داشتن احساسات منفی، خنثی یا مثبت مرتبط هستند، یک عدد مرتبط در مقیاس 10- تا 10+ (از منفی‌ترین تا مثبت‌ترین) یا به سادگی داده می‌شود. از 0 تا حد بالایی مثبت مانند +4. این امکان تنظیم احساس یک اصطلاح معین را نسبت به محیط آن (معمولاً در سطح جمله) فراهم می کند. هنگامی که یک قطعه از متن بدون ساختار با استفاده از پردازش زبان طبیعی تجزیه و تحلیل می شود ، به هر مفهوم در محیط مشخص شده امتیازی بر اساس نحوه ارتباط کلمات احساسی با مفهوم و امتیاز مرتبط با آن داده می شود. [14] [15] این امکان حرکت به سمت درک پیچیده‌تری از احساسات را می‌دهد، زیرا اکنون می‌توان ارزش احساسی یک مفهوم را نسبت به تغییراتی که ممکن است آن را احاطه کرده است تنظیم کرد. به عنوان مثال، کلماتی که احساسات بیان شده توسط این مفهوم را تشدید، آرام می کنند یا نفی می کنند، می توانند بر امتیاز آن تأثیر بگذارند. از طرف دیگر، اگر هدف تعیین احساسات در متن باشد به جای قطبیت و قدرت کلی متن، می‌توان به متون نمره قوت احساسات مثبت و منفی داد. [16]

انواع مختلفی از تجزیه و تحلیل احساسات وجود دارد، مانند تجزیه و تحلیل احساسات مبتنی بر جنبه، تجزیه و تحلیل احساسات درجه بندی (مثبت، منفی، خنثی)، تجزیه و تحلیل احساسات چند زبانه و تشخیص احساسات.

شناسایی ذهنیت/عینیت

این وظیفه معمولاً به عنوان طبقه بندی یک متن معین (معمولاً یک جمله) به یکی از دو کلاس: عینی یا ذهنی تعریف می شود. [17] این مشکل گاهی اوقات می تواند دشوارتر از طبقه بندی قطبی باشد. [18] ذهنی بودن کلمات و عبارات ممکن است به بافت آنها بستگی داشته باشد و یک سند عینی ممکن است حاوی جملات ذهنی باشد (مثلاً، یک مقاله خبری به نقل از نظرات مردم). علاوه بر این، همانطور که توسط سو ذکر شد، [19] نتایج تا حد زیادی به تعریف ذهنیت مورد استفاده در هنگام حاشیه نویسی متون وابسته است. با این حال، Pang [20] نشان داد که حذف جملات عینی از یک سند قبل از طبقه بندی قطبیت آن به بهبود عملکرد کمک می کند.

شناسایی ذهنی و عینی، وظایف فرعی در حال ظهور تجزیه و تحلیل احساسات برای استفاده از ویژگی‌های نحوی، معنایی و دانش یادگیری ماشینی برای تشخیص اینکه آیا یک جمله یا سند حاوی حقایق یا نظرات است یا خیر. آگاهی از شناخت واقعیات و نظرات اخیر نیست، احتمالاً برای اولین بار توسط Carbonell در دانشگاه Yale در سال 1979 ارائه شده است .

اصطلاح هدف به حادثه ای اشاره دارد که حاوی اطلاعات واقعی است. [21]

اصطلاح ذهنی این حادثه را توصیف می‌کند که حاوی اطلاعات غیر واقعی به اشکال مختلف است، مانند نظرات شخصی، قضاوت و پیش‌بینی‌ها، همچنین به عنوان «ایالت‌های خصوصی» شناخته می‌شوند. [22] در مثال زیر، یک ایالت خصوصی "ما آمریکایی ها" را منعکس می کند. علاوه بر این، نهاد هدف اظهار نظر شده توسط نظرات می تواند به اشکال مختلفی از محصول ملموس تا موضوعات ناملموس بیان شده در لیو (2010) باشد. [23] علاوه بر این، سه نوع نگرش توسط لیو (2010) مشاهده شد، 1) نظرات مثبت، 2) نظرات خنثی، و 3) نظرات منفی. [23]

این تحلیل یک مشکل طبقه بندی است. [24]

مجموعه کلمات یا نشانگرهای عبارات هر کلاس برای مکان یابی الگوهای مطلوب در متن بدون حاشیه تعریف شده است. برای بیان ذهنی، فهرست کلمات متفاوتی ایجاد شده است. فهرست‌هایی از شاخص‌های ذهنی در کلمات یا عبارات توسط چندین محقق در زمینه‌های زبان‌شناس و پردازش زبان طبیعی در Riloff و همکاران ایجاد شده است. (2003). [25] یک فرهنگ لغت از قوانین استخراج باید برای اندازه گیری عبارات داده شده ایجاد شود. در طی سال‌ها، در تشخیص ذهنی، پیشرفت استخراج ویژگی‌ها از تنظیم ویژگی‌ها با دست به یادگیری ویژگی‌های خودکار می‌رود. در حال حاضر، روش‌های یادگیری خودکار می‌توانند به یادگیری ماشینی نظارت‌شده و بدون نظارت تقسیم شوند . استخراج الگوها با فرآیند یادگیری ماشینی مشروح و بدون حاشیه به طور گسترده توسط محققان دانشگاهی مورد بررسی قرار گرفته است.

با این حال، محققان چندین چالش را در ایجاد مجموعه‌های ثابتی از قوانین برای عبارات تشخیص دادند. بسیاری از چالش ها در توسعه قوانین از ماهیت اطلاعات متنی ناشی می شود. شش چالش توسط چندین محقق تشخیص داده شده است: 1) عبارات استعاری، 2) اختلاف در نوشته ها، 3) حساس به بافت، 4) نمایش کلمات با کاربردهای کمتر، 5) حساس به زمان، و 6) حجم در حال رشد.

  1. عبارات استعاری متن حاوی بیان استعاری است که ممکن است بر عملکرد استخراج تأثیر بگذارد. [26] علاوه بر این، استعاره ها به شکل های مختلفی به خود می گیرند که ممکن است در افزایش تشخیص نقش داشته باشد.
  2. اختلاف در نوشته ها برای متن به‌دست‌آمده از اینترنت، اختلاف در سبک نوشتاری داده‌های متن هدفمند شامل ژانرها و سبک‌های نوشتاری متمایز است.
  3. حساس به متن طبقه بندی ممکن است بر اساس ذهنی بودن یا عینی بودن جملات قبلی و بعدی متفاوت باشد. [24]
  4. ویژگی حساس به زمان این کار با ویژگی حساس به زمان برخی از داده های متنی به چالش کشیده می شود. اگر گروهی از محققین بخواهند واقعیتی را در خبر تایید کنند، به زمان بیشتری برای تایید متقابل نیاز دارند تا اینکه اخبار قدیمی شوند.
  5. کلمات کلیدی با کاربرد کمتر.
  6. حجم در حال رشد. این وظیفه نیز با حجم عظیم داده های متنی به چالش کشیده می شود. ماهیت روزافزون داده‌های متنی، انجام کار را برای محققین به‌موقع دشوار می‌کند.

پیش از این، تحقیقات عمدتاً بر طبقه بندی سطح اسناد متمرکز بود. با این حال، طبقه بندی یک سطح سند از دقت کمتری برخوردار است، زیرا یک مقاله ممکن است دارای انواع مختلفی از عبارات باشد. شواهد پژوهشی مجموعه‌ای از مقالات خبری را نشان می‌دهد که انتظار می‌رود بیان عینی بر آنها غالب باشد، در حالی که نتایج نشان می‌دهد که بیش از 40 درصد بیان ذهنی را شامل می‌شود. [21]

برای غلبه بر این چالش ها، محققان به این نتیجه می رسند که کارایی طبقه بندی کننده به دقت الگوهای یادگیرنده بستگی دارد. و فیدهای یادگیرنده با حجم زیادی از داده‌های آموزشی مشروح، بهتر از آنهایی است که با ویژگی‌های ذهنی کمتر جامع آموزش دیده‌اند. با این حال، یکی از موانع اصلی برای اجرای این نوع کار، تولید مجموعه داده بزرگی از جملات مشروح به صورت دستی است. روش حاشیه نویسی دستی به سه دلیل کمتر از یادگیری خودکار مورد توجه قرار گرفته است:

  1. تفاوت در درک. در کار حاشیه نویسی دستی، به دلیل ابهام زبان ها، ممکن است اختلاف نظر در مورد ذهنی یا عینی بودن یک نمونه در میان حاشیه نویسان رخ دهد.
  2. خطاهای انسانی کار حاشیه نویسی دستی یک تکلیف دقیق است، برای اتمام آن نیاز به تمرکز شدید دارد.
  3. وقت گیر. کار حاشیه نویسی دستی کار سختی است. ریلوف (1996) نشان می دهد که 160 متن 8 ساعت برای یک حاشیه نویس تمام می شود. [27]

همه این دلایل ذکر شده می تواند بر کارایی و اثربخشی طبقه بندی ذهنی و عینی تأثیر بگذارد. بر این اساس، دو روش راه‌اندازی برای یادگیری الگوهای زبانی از داده‌های متنی بدون حاشیه‌نویسی طراحی شد. هر دو روش با تعداد انگشت شماری از کلمات اولیه و داده های متنی بدون حاشیه شروع می شوند.

  1. Meta-Bootstrapping توسط Riloff و Jones در سال 1999. [28] سطح یک: ایجاد الگوهای استخراج بر اساس قوانین از پیش تعریف شده و الگوهای استخراج شده با تعداد کلمات بذری که هر الگو دارد. سطح دو: 5 کلمه برتر علامت گذاری شده و به فرهنگ لغت اضافه می شود. تکرار کنید.
  2. Basilisk ( B ootstrapping A approach to S Emantic L exicon I nduction with S Emantic K nowledge) توسط Thelen و Riloff. [29] مرحله اول: الگوهای استخراج را ایجاد کنید. مرحله دوم: بهترین الگوها را از Pattern Pool به Candidate Word Pool منتقل کنید. مرحله سوم: 10 کلمه برتر علامت گذاری شده و به فرهنگ لغت اضافه می شود. تکرار کنید.

به طور کلی، این الگوریتم‌ها نیاز به تشخیص و استخراج خودکار الگو را در کار ذهنی و عینی برجسته می‌کنند.

طبقه بندی کننده موضوعی و شی می تواند چندین کاربرد پردازش زبان طبیعی را افزایش دهد. یکی از مزایای اصلی طبقه‌بندی‌کننده این است که فرآیندهای تصمیم‌گیری مبتنی بر داده را در صنایع مختلف رواج داد. به گفته لیو، کاربردهای شناسایی ذهنی و عینی در تجارت، تبلیغات، ورزش و علوم اجتماعی اجرا شده است. [30]

بر اساس ویژگی/جنبه

این به تعیین نظرات یا احساسات بیان شده در مورد ویژگی ها یا جنبه های مختلف موجودیت ها، به عنوان مثال، یک تلفن همراه، یک دوربین دیجیتال، یا یک بانک اشاره دارد. [35] یک ویژگی یا جنبه یک ویژگی یا جزء یک موجودیت است، به عنوان مثال، صفحه نمایش تلفن همراه، خدمات یک رستوران، یا کیفیت تصویر یک دوربین. مزیت تجزیه و تحلیل احساسات مبتنی بر ویژگی، امکان گرفتن نکات ظریف در مورد اشیاء مورد علاقه است. ویژگی‌های مختلف می‌توانند واکنش‌های احساسات متفاوتی ایجاد کنند، برای مثال یک هتل می‌تواند موقعیت مناسبی داشته باشد، اما غذای متوسطی داشته باشد. [36] این مشکل شامل چندین مشکل فرعی است، به عنوان مثال، شناسایی نهادهای مرتبط، استخراج ویژگی‌ها/جنبه‌های آن‌ها، و تعیین اینکه آیا نظر ابراز شده در مورد هر ویژگی/جنبه مثبت، منفی یا خنثی است. [37] شناسایی خودکار ویژگی‌ها را می‌توان با روش‌های نحوی، با مدل‌سازی موضوعی ، [38] [39] یا با یادگیری عمیق انجام داد . [40] [41] بحث های دقیق تر در مورد این سطح از تحلیل احساسات را می توان در کار لیو یافت. [23]

رتبه بندی شدت

عواطف و احساسات ماهیت ذهنی دارند. میزان احساسات/احساسات بیان شده در متن معین در سطح سند، جمله، یا ویژگی/جنبه - میزان شدتی که در نظر یک سند، یک جمله یا یک موجود بیان می‌شود ، در هر مورد متفاوت است. اساس [42] با این حال، پیش‌بینی تنها عواطف و احساسات همیشه اطلاعات کاملی را منتقل نمی‌کند. درجه یا سطح احساسات و عواطف اغلب نقش مهمی در درک احساس دقیق در یک کلاس دارد (به عنوان مثال، "خوب" در مقابل "عالی"). برخی از روش‌ها از یک روش مجموعه‌ای انباشته [43] برای پیش‌بینی شدت عواطف و احساسات با ترکیب خروجی‌های به‌دست‌آمده و استفاده از مدل‌های یادگیری عمیق مبتنی بر شبکه‌های عصبی کانولوشنال ، [44] شبکه‌های حافظه کوتاه‌مدت و واحدهای بازگشتی دروازه‌دار استفاده می‌کنند . [45]

روش ها و ویژگی ها

رویکردهای موجود برای تحلیل احساسات را می توان به سه دسته اصلی دسته بندی کرد: تکنیک های مبتنی بر دانش، روش های آماری و رویکردهای ترکیبی. [46] تکنیک‌های دانش‌محور، متن را بر اساس دسته‌های تأثیرگذار بر اساس وجود کلمات تأثیرگذار بدون ابهام مانند شاد، غمگین، ترس، و ملال طبقه‌بندی می‌کنند. [47] برخی از پایگاه‌های دانش نه‌تنها کلمات تأثیرگذار آشکار را فهرست می‌کنند، بلکه واژه‌های دلخواه را «قرابت» احتمالی با احساسات خاص تعیین می‌کنند. [48] ​​روش‌های آماری از عناصر یادگیری ماشینی مانند تحلیل معنایی پنهان ، ماشین‌های برداری پشتیبانی ، " کیف کلمات "، " اطلاعات متقابل نقطه‌ای " برای جهت‌گیری معنایی، [6] مدل‌های فضای معنایی یا مدل‌های جاسازی کلمه ، [49] و یادگیری عمیق . روش‌های پیچیده‌تر سعی می‌کنند دارنده یک احساس (یعنی شخصی که آن حالت عاطفی را حفظ می‌کند) و هدف (یعنی موجودی که تأثیر در مورد آن احساس می‌شود) را شناسایی کنند. [50] برای استخراج نظر در زمینه و دریافت ویژگی که گوینده در مورد آن نظر داشته است، از روابط دستوری کلمات استفاده می شود. روابط وابستگی گرامری با تجزیه عمیق متن به دست می آید. [51] رویکردهای ترکیبی هم از یادگیری ماشین و هم عناصری از بازنمایی دانش مانند هستی شناسی ها و شبکه های معنایی استفاده می کنند تا معنایی را که به شیوه ای ظریف بیان می شوند، شناسایی کنند، به عنوان مثال، از طریق تجزیه و تحلیل مفاهیمی که به صراحت اطلاعات مرتبط را منتقل نمی کنند، اما به طور ضمنی با مفاهیم دیگری که این کار را انجام می دهند مرتبط هستند. [52]

ابزارهای نرم‌افزار متن‌باز و همچنین طیف وسیعی از ابزارهای رایگان و پولی تجزیه و تحلیل احساسات ، تکنیک‌های یادگیری ماشین ، آمار و پردازش زبان طبیعی را برای خودکارسازی تحلیل احساسات در مجموعه‌های بزرگی از متون، از جمله صفحات وب، اخبار آنلاین، گروه‌های بحث اینترنتی، بررسی‌های آنلاین، به کار می‌گیرند. وبلاگ های وب و رسانه های اجتماعی [53] از سوی دیگر، سیستم‌های مبتنی بر دانش، از منابع در دسترس عموم برای استخراج اطلاعات معنایی و عاطفی مرتبط با مفاهیم زبان طبیعی استفاده می‌کنند. این سیستم می تواند به اجرای استدلال عاطفی عاطفی کمک کند . [54] تجزیه و تحلیل احساسات همچنین می تواند بر روی محتوای بصری، به عنوان مثال، تصاویر و ویدئوها انجام شود (به تجزیه و تحلیل احساسات چندوجهی مراجعه کنید ). یکی از اولین رویکردها در این راستا، SentiBank [55] با استفاده از نمایش جفت اسم صفت از محتوای بصری است. علاوه بر این، اکثریت قریب به اتفاق رویکردهای طبقه‌بندی احساسات بر مدل کیسه‌ای از کلمات تکیه می‌کنند، که متن، دستور زبان و حتی ترتیب کلمات را نادیده می‌گیرد . رویکردهایی که احساسات را بر اساس چگونگی ترکیب کلمات به معنای عبارات بلندتر تجزیه و تحلیل می‌کنند، نتیجه بهتری را نشان داده‌اند، [56] اما حاشیه‌نویسی اضافی را به همراه دارند.

یک جزء تجزیه و تحلیل انسانی در تجزیه و تحلیل احساسات مورد نیاز است، زیرا سیستم های خودکار قادر به تجزیه و تحلیل گرایش های تاریخی یک نظر دهنده یا پلت فرم نیستند و اغلب در احساسات ابراز شده آنها به اشتباه طبقه بندی می شوند. اتوماسیون تقریباً بر 23٪ نظراتی که به درستی توسط انسان طبقه بندی شده اند تأثیر می گذارد. [57] با این حال، انسان‌ها اغلب مخالف هستند، و استدلال می‌شود که توافق بین‌انسانی یک حد بالایی را فراهم می‌کند که طبقه‌بندی‌کننده‌های احساسات خودکار در نهایت می‌توانند به آن دست یابند. [58]

ارزیابی

دقت سیستم تجزیه و تحلیل احساسات، اصولاً این است که چقدر با قضاوت های انسانی مطابقت دارد. این معمولاً با معیارهای متغیر مبتنی بر دقت و یادآوری در دو دسته هدف متون منفی و مثبت اندازه‌گیری می‌شود . با این حال، طبق تحقیقات، ارزیاب‌های انسانی معمولاً فقط در مورد 80٪ [59] مواقع موافق هستند (به قابلیت اطمینان بین رتبه‌بندی مراجعه کنید ). بنابراین، برنامه‌ای که به دقت ۷۰ درصد در طبقه‌بندی احساسات دست می‌یابد، تقریباً به خوبی انسان عمل می‌کند، حتی اگر چنین دقتی چشمگیر به نظر نرسد. اگر یک برنامه در 100٪ موارد "درست" بود، انسان ها هنوز هم در 20٪ موارد با آن مخالف بودند، زیرا آنها در مورد هر پاسخی تا این حد مخالف هستند. [ نیازمند منبع ]

از سوی دیگر، سیستم های کامپیوتری خطاهای بسیار متفاوتی نسبت به ارزیاب های انسانی خواهند داشت و بنابراین ارقام کاملاً قابل مقایسه نیستند. به عنوان مثال، یک سیستم کامپیوتری با نفی، اغراق، شوخی یا طعنه مشکل دارد ، که معمولا برای یک خواننده انسانی قابل کنترل است: برخی از خطاهایی که یک سیستم کامپیوتری مرتکب می شود برای انسان بیش از حد ساده به نظر می رسد. به طور کلی، سودمندی برای وظایف تجاری عملی تحلیل احساسات همانطور که در تحقیقات آکادمیک تعریف شده است زیر سوال رفته است، زیرا مدل ساده یک بعدی احساسات از منفی به مثبت اطلاعات عملی کمی را برای مشتری که نگران تأثیر گفتمان عمومی بر شهرت برند یا شرکت. [60] [61] [62]

برای تناسب بهتر با نیازهای بازار، ارزیابی تحلیل احساسات به سمت اقدامات مبتنی بر وظیفه بیشتر همراه با نمایندگان آژانس های روابط عمومی و متخصصان تحقیقات بازار تدوین شده است. تمرکز در مجموعه داده های ارزیابی RepLab کمتر بر محتوای متن مورد بررسی است و بیشتر بر تأثیر متن مورد نظر بر شهرت برند است . [63] [64] [65]

از آنجایی که ارزیابی تجزیه و تحلیل احساسات روز به روز بیشتر مبتنی بر وظیفه می شود، هر پیاده سازی به یک مدل آموزشی جداگانه نیاز دارد تا نمایش دقیق تری از احساسات برای یک مجموعه داده معین به دست آورد.

وب 2.0

ظهور رسانه های اجتماعی مانند وبلاگ ها و شبکه های اجتماعی علاقه به تجزیه و تحلیل احساسات را افزایش داده است. با گسترش بررسی ها، رتبه بندی ها، توصیه ها و سایر اشکال بیان آنلاین، نظرات آنلاین به نوعی ارز مجازی برای مشاغلی تبدیل شده است که به دنبال بازاریابی محصولات خود، شناسایی فرصت های جدید و مدیریت شهرت خود هستند. از آنجایی که کسب‌وکارها به دنبال خودکار کردن فرآیند فیلتر کردن نویز، درک مکالمات، شناسایی محتوای مرتبط و انجام مناسب آن هستند، اکنون بسیاری به دنبال حوزه تحلیل احساسات هستند. [66] پیچیده تر این موضوع، ظهور پلتفرم های رسانه های اجتماعی ناشناس مانند 4chan و Reddit است . [67] اگر وب 2.0 تماماً در مورد دموکراتیزه کردن انتشار بود، مرحله بعدی وب ممکن است مبتنی بر دموکراتیزه کردن داده کاوی تمام محتوایی باشد که منتشر می شود. [68]

یک گام به سوی این هدف در تحقیق انجام می شود. چندین تیم تحقیقاتی در دانشگاه های سراسر جهان در حال حاضر بر درک پویایی احساسات در جوامع الکترونیکی از طریق تجزیه و تحلیل احساسات تمرکز می کنند. [69]

مشکل این است که اکثر الگوریتم‌های تحلیل احساسات از عبارات ساده برای بیان احساسات در مورد یک محصول یا خدمات استفاده می‌کنند. با این حال، عوامل فرهنگی، تفاوت‌های زبانی، و زمینه‌های متفاوت تبدیل یک رشته متن نوشته شده به یک طرفدار یا موافق ساده را بسیار دشوار می‌کند. [66] این واقعیت که انسان‌ها اغلب در مورد احساس متن با هم اختلاف نظر دارند، نشان می‌دهد که چقدر کار بزرگی برای رایانه‌هاست که این کار را درست انجام دهند. هرچه رشته متن کوتاه تر باشد، سخت تر می شود.

حتی اگر رشته های متن کوتاه ممکن است یک مشکل باشد، تجزیه و تحلیل احساسات در میکروبلاگینگ نشان داده است که توییتر می تواند به عنوان یک شاخص آنلاین معتبر از احساسات سیاسی دیده شود. احساسات سیاسی توییت‌ها نشان‌دهنده مکاتبات نزدیک با مواضع سیاسی احزاب و سیاستمداران است، که نشان می‌دهد محتوای پیام‌های توییتر به طور قابل قبولی منعکس‌کننده چشم‌انداز سیاسی آفلاین است. [70] علاوه بر این، تجزیه و تحلیل احساسات در توییتر نیز نشان داده شده است که خلق و خوی عمومی را در پشت چرخه‌های تولید مثل انسان در سطح جهانی، [71] و همچنین سایر مشکلات مربوط به سلامت عمومی مانند واکنش‌های نامطلوب دارویی را نشان می‌دهد. [72]

در حالی که تجزیه و تحلیل احساسات برای حوزه‌هایی که نویسندگان نظر خود را نسبتاً صریح بیان می‌کنند ("فیلم فوق‌العاده است") مانند رسانه‌های اجتماعی و بررسی محصول محبوب بوده است، اخیراً روش‌های قوی برای سایر حوزه‌هایی که احساسات به شدت ضمنی یا غیرمستقیم است ابداع شده است. به عنوان مثال، در مقالات خبری - بیشتر به دلیل عینیت روزنامه نگاری مورد انتظار - روزنامه نگاران اغلب اعمال یا رویدادها را به جای بیان مستقیم قطبیت یک قطعه اطلاعات توصیف می کنند. رویکردهای قبلی با استفاده از لغت نامه ها یا ویژگی های کم عمق یادگیری ماشین قادر به درک "معنای بین خطوط" نبودند، اما اخیرا محققان یک رویکرد مبتنی بر یادگیری عمیق و مجموعه داده ای را پیشنهاد کرده اند که قادر به تجزیه و تحلیل احساسات در مقالات خبری است. [1]

محققان از تجزیه و تحلیل احساسات برای تجزیه و تحلیل توییت های ایمنی و بهداشت ساخت و ساز (که اکنون X نامیده می شود) استفاده کرده اند. این تحقیق نشان داد که بین علاقه مندی ها و ریتوییت ها از نظر ظرفیت احساسات همبستگی مثبت وجود دارد. دیگران تأثیر YouTube بر انتشار دانش ایمنی و بهداشت ساخت و ساز را بررسی کرده اند. آنها از طریق تحلیل معنایی بررسی کردند که چگونه احساسات بر رفتارهای کاربران از نظر مشاهده و اظهار نظر تأثیر می گذارد. در مطالعه دیگری، احساسات مثبت 85 درصد در اشتراک دانش ایمنی و سلامت ساخت و ساز از طریق اینستاگرام را به خود اختصاص داده است. [73]

کاربرد در سیستم های توصیه گر

برای یک سیستم توصیه‌گر ، تحلیل احساسات یک تکنیک ارزشمند است. هدف یک سیستم توصیه‌گر پیش‌بینی اولویت برای یک مورد از یک کاربر هدف است. سیستم های توصیه گر اصلی بر روی مجموعه داده های صریح کار می کنند. به عنوان مثال، فیلتر مشارکتی روی ماتریس رتبه‌بندی کار می‌کند و فیلتر مبتنی بر محتوا روی متا داده‌های آیتم‌ها کار می‌کند.

در بسیاری از سرویس‌های شبکه‌های اجتماعی یا وب‌سایت‌های تجارت الکترونیک ، کاربران می‌توانند بررسی متنی، نظر یا بازخوردی برای موارد ارائه دهند. این متن‌های تولید شده توسط کاربر منبعی غنی از نظرات احساسی کاربر در مورد محصولات و اقلام متعدد است. به طور بالقوه، برای یک آیتم، چنین متنی می تواند هم ویژگی/جنبه های مرتبط مورد و هم احساسات کاربران را در مورد هر ویژگی نشان دهد. [74] ویژگی/جنبه های مورد توضیح داده شده در متن همان نقش را با متا داده ها در فیلترینگ مبتنی بر محتوا ایفا می کند ، اما اولی برای سیستم توصیه گر ارزشمندتر است. از آنجایی که این ویژگی‌ها به طور گسترده توسط کاربران در بررسی‌های خود ذکر می‌شوند، می‌توان آن‌ها را به‌عنوان مهم‌ترین ویژگی‌هایی دانست که می‌توانند به‌طور قابل‌توجهی بر تجربه کاربر در مورد کالا تأثیر بگذارند، در حالی که متا داده‌های مورد (معمولاً توسط تولیدکنندگان به‌جای مصرف‌کنندگان ارائه می‌شود) ممکن است ویژگی هایی را که مورد توجه کاربران است نادیده بگیرد. برای آیتم های مختلف با ویژگی های مشترک، یک کاربر ممکن است احساسات متفاوتی ارائه دهد. همچنین، یک ویژگی از یک مورد ممکن است احساسات متفاوتی را از کاربران مختلف دریافت کند. احساسات کاربران در مورد ویژگی ها را می توان به عنوان یک امتیاز رتبه بندی چند بعدی در نظر گرفت که نشان دهنده ترجیح آنها در مورد موارد است.

بر اساس ویژگی/جنبه ها و احساسات استخراج شده از متن تولید شده توسط کاربر، می توان یک سیستم توصیه گر ترکیبی ساخت. [75] دو نوع انگیزه برای توصیه یک مورد نامزد به کاربر وجود دارد. انگیزه اول این است که آیتم کاندید دارای ویژگی های مشترک متعدد با آیتم های ترجیحی کاربر است، [76] در حالی که انگیزه دوم این است که مورد کاندید احساس بالایی نسبت به ویژگی های خود دریافت می کند. برای یک آیتم ترجیحی، منطقی است که باور کنیم اقلام با ویژگی‌های یکسان عملکرد یا کاربرد مشابهی دارند. بنابراین، این موارد نیز احتمالاً توسط کاربر ترجیح داده می شود. از سوی دیگر، برای ویژگی مشترک دو مورد کاندید، کاربران دیگر ممکن است به یکی از آنها احساسات مثبت بدهند در حالی که به دیگری احساسات منفی بدهند. واضح است که آیتم با ارزیابی بالا باید به کاربر توصیه شود. بر اساس این دو انگیزه، یک امتیاز رتبه بندی ترکیبی از شباهت و رتبه بندی احساسات می تواند برای هر مورد نامزد ایجاد شود. [75]

به جز دشواری خود تجزیه و تحلیل احساسات، اعمال تجزیه و تحلیل احساسات بر روی نظرات یا بازخوردها نیز با چالش هرزنامه ها و بررسی های جانبدارانه مواجه است. یک جهت کار بر ارزیابی مفید بودن هر مرور متمرکز است. [77] بررسی یا بازخورد بد نوشته شده به سختی برای سیستم توصیه‌کننده مفید است. علاوه بر این، یک بررسی می تواند برای جلوگیری از فروش یک محصول هدف طراحی شود، بنابراین حتی اگر به خوبی نوشته شده باشد، برای سیستم توصیه کننده مضر باشد.

محققان همچنین دریافتند که فرم های طولانی و کوتاه متن تولید شده توسط کاربر باید به گونه ای متفاوت برخورد شود. یک نتیجه جالب نشان می دهد که مرورهای کوتاه گاهی اوقات مفیدتر از فرم طولانی هستند، [78] زیرا فیلتر کردن نویز در یک متن کوتاه ساده تر است. برای متن طولانی، افزایش طول متن همیشه باعث افزایش متناسب در تعداد ویژگی‌ها یا احساسات متن نمی‌شود.

Lamba & Madhusudhan [79] با بسته‌بندی مجدد نتایج حاصل از تحلیل احساسات پلتفرم‌های رسانه‌های اجتماعی مانند توییتر و ارائه آن به عنوان یک سرویس مبتنی بر زمان تلفیقی در قالب‌های مختلف، راه جدیدی را برای تأمین نیازهای اطلاعاتی کاربران امروزی کتابخانه معرفی می‌کنند. علاوه بر این، آنها روش جدیدی را برای انجام بازاریابی در کتابخانه ها با استفاده از کاوی رسانه های اجتماعی و تحلیل احساسات پیشنهاد می کنند.

همچنین ببینید

مراجع

  1. ^ آب هامبورگ، فلیکس؛ دانی، کارستن (2021). "NewsMTSC: مجموعه داده ای برای طبقه بندی احساسات (چند) وابسته به هدف در مقالات اخبار سیاسی". مجموعه مقالات شانزدهمین کنفرانس فصل اروپایی انجمن زبانشناسی محاسباتی: جلد اصلی
  2. وونگ آن هو، دوونگ هوین-کنگ نگوین، دان هوانگ نگوین، لین تی وان فام، دوک-وو نگوین، کیت ون نگوین، نگان لو-توی نگوین. "تشخیص احساسات برای متن رسانه های اجتماعی ویتنامی". در مجموعه مقالات کنفرانس بین المللی 2019 انجمن زبانشناسی محاسباتی اقیانوس آرام (PACLING 2019)، هانوی، ویتنام (2019).
  3. استون، فیلیپ جی، دکستر سی. دانفی، و مارشال اس. اسمیت. پرسشگر عمومی: رویکرد کامپیوتری به تحلیل محتوا. مطبوعات MIT، کمبریج، MA (1966).
  4. گوتچالک، لوئیس آگوست و گلدین سی گلسر . سنجش حالات روانشناختی از طریق تحلیل محتوای رفتار کلامی. انتشارات دانشگاه کالیفرنیا، 1969.
  5. USA Issued 7,136,877, Volcani, Yanon; و فوگل، دیوید بی، "سیستم و روش برای تعیین و کنترل تاثیر متن"، منتشر شده در 28 ژوئن 2001 
  6. ↑ اب تورنی، پیتر (2002). "Thumbs Up or Thumbs Down؟ جهت گیری معنایی اعمال شده در طبقه بندی بدون نظارت مرورها". مجموعه مقالات انجمن زبانشناسی محاسباتی . صص 417-424. arXiv : cs.LG/0212032 .
  7. ^ پنگ، بو؛ لی، لیلیان ؛ وایتیاناتان، شیواکومار (2002). "شست بالا؟ طبقه بندی احساسات با استفاده از تکنیک های یادگیری ماشین". مجموعه مقالات کنفرانس روشهای تجربی در پردازش زبان طبیعی (EMNLP) . صص 79-86.
  8. ^ ab Pang، Bo; لی، لیلیان (2005). "دیدن ستاره ها: بهره برداری از روابط طبقاتی برای طبقه بندی احساسات با توجه به مقیاس های رتبه بندی". مجموعه مقالات انجمن زبانشناسی محاسباتی (ACL) . صص 115-124.
  9. ^ آب اسنایدر، بنجامین؛ بارزیلای، رجینا (2007). "رتبه بندی چند جنبه با استفاده از الگوریتم غم خوب". مجموعه مقالات فناوری مشترک زبان انسانی/فصل آمریکای شمالی کنفرانس ACL (HLT-NAACL) . صص 300-307. بایگانی شده از نسخه اصلی در ۶ اوت ۲۰۱۶ . بازیابی شده در 16 ژوئن 2009 .
  10. کو، یان، جیمز شاناهان و جانیس ویبی . "کاوش نگرش و تاثیر در متن: نظریه ها و کاربردها." در سمپوزیوم بهار AAAI، گزارش فنی SS-04-07. مطبوعات AAAI، منلو پارک، کالیفرنیا. 2004.
  11. Vryniotis، Vasilis (2013). اهمیت طبقه خنثی در تحلیل احساسات.
  12. ^ کوپل، موشه؛ شلر، جاناتان (2006). "اهمیت مثال های خنثی برای یادگیری احساسات". هوش محاسباتی 22 . صص 100-109. CiteSeerX 10.1.1.84.9735 . 
  13. ریبیرو، فیلیپه نونس؛ آرائوجو، ماتئوس (2010). "مقایسه معیار روشهای تحلیل احساسات در حال حاضر". معاملات در سیستم های محاسباتی جاسازی شده 9 (4).
  14. تابوادا، مایت؛ بروک، جولیان (2011). "روش های مبتنی بر واژگان برای تحلیل احساسات". زبانشناسی محاسباتی . 37 (2): 272-274. CiteSeerX 10.1.1.188.5517 . doi :10.1162/coli_a_00049. S2CID  3181362. 
  15. آگوستینیاک، لوکاس؛ شیمانسکی، پیوتر؛ Kajdanowicz، Tomasz; Tuligłowicz, Włodzimierz (25 دسامبر 2015). "مطالعه جامع در تحلیل احساسات دسته بندی گروهی مبتنی بر فرهنگ لغت". آنتروپی18 (1): 4. Bibcode :2015Entrp..18....4A. doi : 10.3390/e18010004 .
  16. ^ تلوال، مایک؛ باکلی، کیوان؛ پالتوگلو، جورجیوس؛ کای، دی; کاپاس، آروید (2010). "تشخیص قدرت احساسات در متن غیر رسمی کوتاه". مجله انجمن علوم و فناوری اطلاعات آمریکا . 61 (12): 2544-2558. CiteSeerX 10.1.1.278.3863 . doi :10.1002/asi.21416. 
  17. ^ پنگ، بو؛ لی، لیلیان (2008). "4.1.2 تشخیص ذهنیت و شناسایی عقیده". نظر کاوی و تحلیل احساسات . Now Publishers Inc.
  18. ^ Mihalcea, Rada; بانه، کارمن؛ ویبی، جانیس (2007). "یادگیری زبان ذهنی چندزبانه از طریق پیش بینی های چند زبانه" (PDF) . مجموعه مقالات انجمن زبانشناسی محاسباتی (ACL) . ص 976-983. بایگانی شده از نسخه اصلی (PDF) در 8 ژوئیه 2010.
  19. ^ سو، فانگژونگ؛ مارکرت، کاتیا (2008). "از کلمات تا حواس: مطالعه موردی در بازشناسی ذهنیت" (PDF) . مجموعه مقالات کولینگ 2008، منچستر، انگلستان .
  20. ^ پنگ، بو؛ لی، لیلیان (2004). "آموزش عاطفی: تحلیل احساسات با استفاده از خلاصه سازی ذهنی بر اساس حداقل برش". مجموعه مقالات انجمن زبانشناسی محاسباتی (ACL) . صص 271-278.
  21. ^ آب ویبی، جانیس ؛ ریلوف، الن (2005). «ایجاد طبقه بندی جملات موضوعی و عینی از متون بدون حاشیه». در گلبخ، اسکندر (ویرایش). زبان شناسی محاسباتی و پردازش هوشمند متن . نکات سخنرانی در علوم کامپیوتر. جلد 3406. برلین، هایدلبرگ: اسپرینگر. صص 486-497. doi :10.1007/978-3-540-30586-6_53. شابک 978-3-540-30586-6.
  22. ^ کویرک، راندولف؛ گرین باوم، سیدنی؛ جفری، زالو؛ جان، سوارتویک (1985). گرامر جامع زبان انگلیسی (General Grammar) . لانگمن . صص 175-239. شابک 1933108312.
  23. ^ abc لیو، بینگ (2010). "تحلیل احساسات و ذهنیت" (PDF) . در ایندورخیا، ن. Damerau، FJ (ویرایش‌ها). راهنمای پردازش زبان طبیعی (ویرایش دوم).
  24. ^ ab Pang، Bo; لی، لیلیان (6 ژوئیه 2008). "نظر کاوی و تحلیل احساسات". مبانی و روند در بازیابی اطلاعات . 2 (1-2): 1-135. doi : 10.1561/1500000011. ISSN  1554-0669. S2CID  207178694.
  25. ^ ریلوف، الن؛ Wiebe, Janyce (11 ژوئیه 2003). "یادگیری الگوهای استخراج برای عبارات ذهنی". مجموعه مقالات کنفرانس 2003 در مورد روشهای تجربی در پردازش زبان طبیعی - . EMNLP '03. جلد 10. ایالات متحده آمریکا: انجمن زبانشناسی محاسباتی. صص 105-112. doi : 10.3115/1119355.1119369 . S2CID  6541910.
  26. ^ ویبی، جانیس ؛ ریلوف، الن (ژوئیه 2011). «یافتن سود متقابل بین تحلیل ذهنیت و استخراج اطلاعات». تراکنش های IEEE در محاسبات مؤثر . 2 (4): 175-191. doi :10.1109/T-AFFC.2011.19. ISSN  1949-3045. S2CID  16820846.
  27. ریلوف، الن (اول اوت 1996). "مطالعه تجربی ساخت فرهنگ لغت خودکار برای استخراج اطلاعات در سه حوزه". هوش مصنوعی . 85 (1): 101-134. doi : 10.1016/0004-3702(95)00123-9 . ISSN  0004-3702.
  28. ^ ریلوف، الن؛ جونز، رزی (ژوئیه 1999). "یادگیری فرهنگ لغت برای استخراج اطلاعات با بوت استرپ چند سطحی" (PDF) . AAAI '99/IAAI '99: مجموعه مقالات شانزدهمین کنفرانس ملی هوش مصنوعی و یازدهمین کنفرانس کاربردهای نوآورانه هوش مصنوعی کاربردهای نوآورانه هوش مصنوعی : 474–479.
  29. ^ تلن، مایکل؛ ریلوف، الن (6 ژوئیه 2002). "روش بوت استرپینگ برای یادگیری واژگان معنایی با استفاده از زمینه های الگوی استخراج". مجموعه مقالات کنفرانس ACL-02 در مورد روش های تجربی در پردازش زبان طبیعی - EMNLP '02 . جلد 10. ایالات متحده آمریکا: انجمن زبانشناسی محاسباتی. صص 214-221. doi : 10.3115/1118693.1118721 . S2CID  137155.
  30. لیو، بینگ (23 مه 2012). "تحلیل احساسات و نظرکاوی". سخنرانی های ترکیبی در مورد فن آوری های زبان انسانی . 5 (1): 1-167. doi : 10.2200/S00416ED1V01Y201204HLT016. ISSN  1947-4040. S2CID  38022159. بایگانی شده از نسخه اصلی در 10 مه 2021 . بازیابی شده در 9 دسامبر 2020 .
  31. گانیون، کایل (17 مه 2024). "چگونه هوش مصنوعی بررسی های آنلاین را به هوش تجاری عملی تبدیل می کند". Widewail . بازبینی شده در 19 سپتامبر 2024 .
  32. ^ دنگ، شانگکون؛ میتسوبوچی، تاکاشی؛ شیودا، کی؛ شیمادا، تاتسورو؛ ساکورای، آکیتو (دسامبر 2011). "ترکیب تحلیل فنی با تحلیل احساسات برای پیش بینی قیمت سهام". 2011 نهمین کنفرانس بین المللی IEEE در محاسبات قابل اعتماد، خودمختار و ایمن . IEEE. صص 800-807. doi :10.1109/dasc.2011.138. شابک 978-1-4673-0006-3. S2CID  15262023.
  33. ^ نگوین، کیت وان؛ نگوین، وو دوک؛ نگوین، فو پانزدهم؛ تروونگ، تام تی. نگوین، نگان LT. (1 اکتبر 2018). "UIT-VSFC: مجموعه بازخورد دانشجویان ویتنامی برای تجزیه و تحلیل احساسات". 2018 دهمین کنفرانس بین المللی دانش و مهندسی سیستم ها (KSE) . ویتنام: IEEE. صص 19-24. doi :10.1109/KSE.2018.8573337. شابک 978-1-5386-6113-0. S2CID  56172224.
  34. ^ یو، هنگ؛ Hatzivassiloglou, Vasileios (11 ژوئیه 2003). «به سوی پاسخ به سؤالات نظری». مجموعه مقالات کنفرانس 2003 در مورد روشهای تجربی در پردازش زبان طبیعی - . EMNLP '03. جلد 10. ایالات متحده آمریکا: انجمن زبانشناسی محاسباتی. صص 129-136. doi : 10.3115/1119355.1119372 .
  35. ^ هو، مینکینگ؛ لیو، بینگ (2004). "کاوی و خلاصه کردن نظرات مشتریان". مجموعه مقالات KDD 2004 .
  36. ^ کاتالدی، ماریو؛ بالاتوره، آندریا؛ تیدی، ایلاریا؛ Aufaure، Marie-Aude (22 ژوئن 2013). "موقعیت مکانی خوب، غذای وحشتناک: تشخیص احساسات ویژگی در بررسی های تولید شده توسط کاربر". تحلیل و استخراج شبکه های اجتماعی . 3 (4): 1149-1163. CiteSeerX 10.1.1.396.9313 . doi :10.1007/s13278-013-0119-7. ISSN  1869-5450. S2CID  5025282. 
  37. ^ لیو، بینگ؛ هو، مین کینگ؛ چنگ، جونشنگ (2005). "Opinion Observer: تجزیه و تحلیل و مقایسه نظرات در وب". مجموعه مقالات WWW 2005 .
  38. ^ ژای، ژونگ وو؛ لیو، بینگ؛ خو، هوآ؛ جیا، پیفا (1 ژانویه 2011). "LDA محدود برای گروه بندی ویژگی های محصول در نظر کاوی". در هوانگ، Joshua Zhexue; کائو، لانگبینگ؛ Srivastava، Jaideep (ویرایشگران). پیشرفت در کشف دانش و داده کاوی . نکات سخنرانی در علوم کامپیوتر. جلد 6634. اسپرینگر برلین هایدلبرگ. ص 448-459. CiteSeerX 10.1.1.221.5178 . doi :10.1007/978-3-642-20841-6_37. شابک  978-3-642-20840-9.
  39. ^ تیتوف، ایوان؛ مک دونالد، رایان (1 ژانویه 2008). "مدل سازی نقدهای آنلاین با مدل های موضوعی چند دانه". مجموعه مقالات هفدهمین کنفرانس بین المللی وب جهانی . WWW '08. نیویورک، نیویورک، ایالات متحده آمریکا: ACM. صص 111-120. arXiv : 0801.1063 . doi :10.1145/1367497.1367513. شابک 978-1-60558-085-2. S2CID  13609860.
  40. ^ لیانگ، بین؛ و همکاران (2022). "تحلیل احساسات مبتنی بر جنبه از طریق شبکه های کانولوشنال گراف افزایش یافته دانش عاطفی". سیستم های دانش بنیان 235 : 107643. doi :10.1016/j.knosys.2021.107643. S2CID  237258427.
  41. ^ ما، یوکان؛ و همکاران (2018). "تحلیل احساسات مبتنی بر جنبه هدفمند از طریق جاسازی دانش عامیانه در یک LSTM توجه". مجموعه مقالات AAAI . صص 5876-5883.
  42. ^ شارما، راکشا؛ سومانی; کومار; Bhattacharyya (2017). "رتبه بندی شدت احساسات در میان صفت ها با استفاده از تعبیه کلمه حاوی احساسات" (PDF) . انجمن زبانشناسی محاسباتی : 547-552.
  43. ^ MS Akhtar, A. Ekbal and E. Cambria, "How Intense You? Predicting Intensities of Emotions and Sentiments using Stacked Ensemble [Application Notes]," در مجله IEEE Computational Intelligence Magazine ، جلد. 15، شماره 1، صفحات 64-75، فوریه 2020، doi: 10.1109/MCI.2019.2954667.
  44. ^ X. اویانگ، پی. محاسبات و ارتباطات همه جا حاضر؛ محاسبات قابل اعتماد، خودمختار و ایمن؛ هوش فراگیر و محاسبات، 2015، صفحات 2359-2364، doi: 10.1109/CIT/IUCC/DASC/PICOM.2015.349.
  45. Y. Santur، "تحلیل احساسات بر اساس واحد تکراری دردار،" سمپوزیوم بین المللی هوش مصنوعی و پردازش داده 2019 (IDAP)، 2019، صفحات 1-5، doi: 10.1109/IDAP.2019.8875985.
  46. ^ کامبریا، ای؛ شولر، بی. Xia، Y; هواسی، سی (1392). "راه های جدید در نظر کاوی و تحلیل احساسات". سیستم های هوشمند IEEE 28 (2): 15-21. CiteSeerX 10.1.1.688.1384 . doi :10.1109/MIS.2013.30. S2CID  12104996. 
  47. ^ اورتونی، اندرو؛ کلور، جی. کالینز، A (1988). ساختار شناختی احساسات (PDF) . دانشگاه کمبریج را فشار دهید. بایگانی شده از نسخه اصلی (PDF) در 23 نوامبر 2015.
  48. ^ استیونسون، رایان؛ میکلز، جوزف؛ جیمز، توماس (2007). "مشخص سازی هنجارهای عاطفی برای کلمات انگلیسی بر اساس مقوله های عاطفی گسسته". روشهای تحقیق رفتار . 39 (4): 1020-1024. doi : 10.3758/bf03192999 . PMID  18183921. S2CID  6673690.
  49. ^ سالگرن، مگنوس ؛ کارلگرن، جوسی؛ اریکسون، گونار (2007). " حاشیه نویسی ظرفیت بر اساس دانه ها در فضای کلمه". مجموعه مقالات چهارمین کارگاه بین المللی ارزیابی معنایی (SemEval-2007) .
  50. ^ کیم، اس ام؛ هووی، ای اچ (2006). «شناسایی و تحلیل نظرات قضاوتی». (PDF) . مجموعه مقالات کنفرانس فناوری زبان انسانی / انجمن زبانشناسی محاسباتی آمریکای شمالی (HLT-NAACL 2006). نیویورک، نیویورک . بایگانی شده از نسخه اصلی (PDF) در 29 ژوئن 2011.
  51. ^ دی، لیپیکا؛ Haque, SK Mirajul (2008). "کاوی نظر از داده های متن پر سر و صدا". مجموعه مقالات دومین کارگاه تحلیلی برای داده های متنی بدون ساختار نویزدار، ص 83-90 .
  52. ^ کامبریا، ای؛ حسین، الف (2015). محاسبات معنایی: چارچوبی مبتنی بر حس مشترک برای تحلیل احساسات در سطح مفهومی. اسپرینگر. شابک 9783319236544.
  53. آکورا، کنیت گورکان؛ بایر، مرات علی; دمیرباس، مورات; فرهاتوسمان اوغلو، هاکان (2010). «شناسایی نقاط گسست در افکار عمومی». SigKDD، مجموعه مقالات اولین کارگاه در مورد تجزیه و تحلیل رسانه های اجتماعی .
  54. ^ کامبریا، اریک؛ لیو، کیان؛ دچرچی، سرجیو؛ زینگ، فرانک؛ کواک، کنت (2022). "SenticNet 7: چارچوب هوش مصنوعی عصبی نمادین مبتنی بر عام برای تجزیه و تحلیل احساسات قابل توضیح" (PDF) . مجموعه مقالات LREC . صص 3829–3839.
  55. ^ بورث، دامیان؛ جی، رونگرونگ؛ چن، تائو؛ بروئل، توماس؛ چانگ، شیفو (2013). "هستی شناسی احساسات بصری در مقیاس بزرگ و آشکارسازها با استفاده از جفت اسم صفت". مجموعه مقالات ACM Int. کنفرانس چند رسانه ای . صص 223-232. بایگانی‌شده از نسخه اصلی در ۱۵ آوریل ۲۰۲۱ . بازبینی شده در ۲ نوامبر ۲۰۱۷ .
  56. ^ سوچر، ریچارد؛ پرلیگین، الکس؛ وو، ژان ی. چوانگ، جیسون؛ منینگ، کریستوفر دی. نگ، اندرو ی. پاتس، کریستوفر (2013). "مدل های عمیق بازگشتی برای ترکیب معنایی بر روی یک درخت احساس". در مجموعه مقالات EMNLP : 1631-1642. CiteSeerX 10.1.1.593.7427 . 
  57. «مطالعه موردی: تحلیل احساسات پیشرفته». بایگانی شده از نسخه اصلی در 29 اکتبر 2013 . بازبینی شده در 18 اکتبر 2013 .
  58. ^ موزتیک، ایگور؛ گرچار، میها; اسمایلوویچ، یاسمینا (5 مه 2016). "طبقه بندی احساسات چند زبانه توییتر: نقش حاشیه نویسان انسانی". PLOS ONE . 11 (5): e0155036. arXiv : 1602.07563 . Bibcode :2016PLoSO..1155036M. doi : 10.1371/journal.pone.0155036 . ISSN  1932-6203. PMC 4858191 . PMID  27149621. 
  59. Ogneva، M. "چگونه شرکت ها می توانند از تجزیه و تحلیل احساسات برای بهبود تجارت خود استفاده کنند". قابل مشروب کردن . بازبینی شده در 13 دسامبر 2012 .
  60. کارلگرن، جوسی ، مگنوس سالگرن ، فردریک اولسون، فردریک اسپینوزا و اولا هامفورس. "مفید بودن تحلیل احساسات." در کنفرانس اروپایی بازیابی اطلاعات، صص 426-435. اسپرینگر برلین هایدلبرگ، 2012.
  61. کارلگرن، جوسی . "رابطه خلق و عاطفه نویسنده با احساس در متن و ژانر متن." در مجموعه مقالات چهارمین کارگاه بهره برداری از حاشیه نویسی معنایی در بازیابی اطلاعات، ص 9-10. ACM، 2011.
  62. کارلگرن، جوسی . "تأثیر، جذابیت، و احساسات به عنوان عوامل موثر بر تعامل با اطلاعات چند رسانه ای." در مجموعه مقالات کارگاه آموزشی تزیوس/ImageCLEF در مورد ارزیابی بازیابی اطلاعات بصری، ص 8-11. 2009.
  63. آمیگو، انریکه، آدولفو کوروخو، خولیو گونزالو، ادگار میج و مارتن د ریکه . "نمای کلی RepLab 2012: ارزیابی سیستم های مدیریت شهرت آنلاین." در CLEF (یادداشت های کاری آنلاین / آزمایشگاه ها / کارگاه). 2012.
  64. آمیگو، انریکه، خورخه کاریلو دی آلبورنوز، ایرینا چوگور، آدولفو کوروخو، خولیو گونزالو، تامارا مارتین، ادگار میج، مارتن د ریکه و دامیانو اسپینا. بررسی اجمالی replab 2013: ارزیابی سیستم های نظارت بر شهرت آنلاین. در کنفرانس بین المللی انجمن ارزیابی بین زبانی برای زبان های اروپایی، صفحات 333-352. اسپرینگر برلین هایدلبرگ، 2013.
  65. آمیگو، انریکه، خورخه کاریلو د آلبورنوز، ایرینا چوگور، آدولفو کوروخو، خولیو گونزالو، ادگار میج، مارتن د ریکه و دامیانو اسپینا. مروری بر replab 2014: مشخصات نویسنده و ابعاد شهرت برای مدیریت شهرت آنلاین. در کنفرانس بین المللی انجمن ارزیابی بین زبانی برای زبان های اروپایی، صفحات 307-322. انتشارات بین المللی اسپرینگر، 2014.
  66. ^ اب رایت، الکس. "کاوش کردن وب برای احساسات، نه واقعیت ها"، نیویورک تایمز ، 23/08/2009. بازیابی شده در 01/10/2009.
  67. «تحلیل احساسات در Reddit». 30 سپتامبر 2014 . بازیابی شده در 10 اکتبر 2014 .
  68. کرک پاتریک، مارشال. ", ReadWriteWeb , 2009-04-15. بازیابی شده در 01-10-2009.
  69. ^ کاندلیف، جیمی. "شعله ور باعث می شود شبکه های اجتماعی آنلاین"، نیوساینتیست ، 07/12/2010. بازیابی شده در 2010-12-13.
  70. توماسجان، آندرانیک؛ O.Sprenger، تیم; G.Sandner, Philipp; ام.ولپه، ایزابل (2010). «پیش‌بینی انتخابات با توییتر: آنچه 140 شخصیت درباره احساسات سیاسی آشکار می‌کنند» در 12 دسامبر 2020 در Wayback Machine بایگانی شد . مجموعه مقالات چهارمین کنفرانس بین المللی AAAI در وبلاگ ها و رسانه های اجتماعی
  71. ^ وود، یان بی. وارلا، پدرو ال. بولن، یوهان؛ روشا، لوئیس ام. Gonçalves-Sá، Joana (2017). "چرخه های جنسی انسان توسط فرهنگ هدایت می شود و با خلق و خوی جمعی مطابقت دارد". گزارش های علمی 7 (1): 17973. arXiv : 1707.03959 . Bibcode :2017NatSR...717973W. doi :10.1038/s41598-017-18262-5. PMC 5740080 . PMID  29269945. 
  72. کورکنتزلوس، یوانیس؛ نیک فرجام، آزاده; شاردلو، متیو؛ سارکر، عابد؛ آنانیادو، سوفیا؛ گونزالس، گراسیلا اچ. (2016). "تحلیل تاثیر تجزیه و تحلیل احساسات بر استخراج واکنش های نامطلوب دارویی از توییت ها و پست های انجمن". مجله انفورماتیک زیست پزشکی . 62 : 148-158. doi :10.1016/j.jbi.2016.06.007. PMC 4981644 . PMID  27363901. 
  73. ^ زنگ، ال. لی، RYM؛ Yigitcanlar، T. Zeng, H. استخراج افکار عمومی در مورد سلامت و ایمنی ساخت و ساز: رویکرد تخصیص دیریکله پنهان. Buildings 2023, 13, 927. https://doi.org/10.3390/buildings13040927
  74. ^ تانگ، هویفنگ؛ تان، سونگبو؛ چنگ، ژویقی (2009). "نظرسنجی در مورد تشخیص احساسات نظرات" (PDF) . سیستم های خبره با برنامه های کاربردی 36 (7): 10760-10773. doi :10.1016/j.eswa.2009.02.063. S2CID  2178380. بایگانی شده از نسخه اصلی (PDF) در 24 مه 2018.
  75. ^ آب جاکوب، نیکلاس، و همکاران. "فراتر از ستاره ها: بهره برداری از نظرات کاربران متن آزاد برای بهبود دقت توصیه های فیلم." مجموعه مقالات اولین کارگاه بین المللی CIKM در مورد تحلیل موضوع-احساس برای افکار عمومی . ACM، 2009.
  76. ^ مینکینگ، هو؛ لیو، بینگ (2004). "ویژگی های نظرات استخراج در نظرات مشتریان" (PDF) . AAAI4 (4). S2CID  5724860. بایگانی شده از نسخه اصلی (PDF) در 24 مه 2018.
  77. ^ لیو، یانگ؛ هوانگ، شیانگجی؛ An، Aijun; یو، شیائوهوی (2008). "مدل سازی و پیش بینی مفید بودن بررسی های آنلاین" (PDF) . ICDM'08. هشتمین کنفرانس بین المللی IEEE در مورد داده کاوی . IEEE. صص 443-452. doi :10.1109/ICDM.2008.94. شابک 978-0-7695-3502-9. S2CID  18235238.
  78. ^ برمنگام، آدام؛ اسمیتون، آلن اف (2010). "طبقه بندی احساسات در میکروبلاگ". مجموعه مقالات نوزدهمین کنفرانس بین المللی مدیریت اطلاعات و دانش ACM (PDF) . صفحات 1833-1836. doi :10.1145/1871437.1871741. شابک 9781450300995. S2CID  2084603.
  79. ^ لامبا، مانیکا؛ مادوسودان، مارگام (2018). "کاربرد تحلیل احساسات در کتابخانه ها برای ارائه خدمات اطلاعات زمانی: مطالعه موردی در جنبه های مختلف بهره وری". تحلیل و استخراج شبکه های اجتماعی . 8 (1): 1-12. doi :10.1007/s13278-018-0541-y. S2CID  53047128.