Semantic Scholar یک ابزار تحقیقاتی برای ادبیات علمی است که توسط هوش مصنوعی طراحی شده است . این در موسسه آلن برای هوش مصنوعی توسعه یافته است و در نوامبر 2015 به صورت عمومی منتشر شد. [2] Semantic Scholar از تکنیک های مدرن در پردازش زبان طبیعی برای پشتیبانی از فرآیند تحقیق استفاده می کند، به عنوان مثال با ارائه خلاصه های تولید شده به طور خودکار از مقالات علمی. [3] تیم Semantic Scholar به طور فعال در حال تحقیق در مورد استفاده از هوش مصنوعی در پردازش زبان طبیعی ، یادگیری ماشین ، تعامل انسان و کامپیوتر و بازیابی اطلاعات است . [4]
Semantic Scholar به عنوان پایگاه داده ای برای موضوعات علوم کامپیوتر ، زمین شناسی و علوم اعصاب شروع شد . [5] در سال 2017، این سیستم شروع به گنجاندن ادبیات زیست پزشکی در مجموعه خود کرد. [5] از سپتامبر 2022 [به روز رسانی]، شامل بیش از 200 میلیون نشریه از همه زمینههای علمی است. [6]
Semantic Scholar خلاصه یک جمله ای از ادبیات علمی را ارائه می دهد . یکی از اهداف آن پرداختن به چالش خواندن عناوین متعدد و چکیده های طولانی در دستگاه های تلفن همراه بود. [7] همچنین به دنبال این است که اطمینان حاصل شود که سه میلیون مقاله علمی منتشر شده سالانه به دست خوانندگان برسد، زیرا تخمین زده میشود که تنها نیمی از این مقالات خوانده میشوند. [8]
هوش مصنوعی برای به تصویر کشیدن ماهیت یک مقاله، تولید آن از طریق یک تکنیک "انتزاعی" استفاده می شود. [3] این پروژه از ترکیبی از یادگیری ماشین ، پردازش زبان طبیعی ، و بینایی ماشین برای افزودن لایهای از تحلیل معنایی به روشهای سنتی تحلیل استناد و استخراج شکلها، جداول ، موجودیتها و مکانهای مربوطه از مقالات استفاده میکند. [9] [10]
یکی دیگر از ویژگیهای کلیدی مبتنی بر هوش مصنوعی، Research Feeds است، یک توصیهکننده تحقیق تطبیقی که از هوش مصنوعی برای یادگیری سریع مقالاتی که کاربران به خواندن اهمیت میدهند استفاده میکند و آخرین تحقیقات را توصیه میکند تا به محققان کمک کند بهروز بمانند. از یک مدل جاسازی کاغذ پیشرفته استفاده میکند که با استفاده از یادگیری متضاد آموزش داده شده است تا مقالههایی مشابه کاغذهای موجود در هر پوشه کتابخانه پیدا کند. [11]
Semantic Scholar همچنین Semantic Reader را ارائه میکند، خوانندهای تقویتشده با پتانسیل ایجاد انقلابی در خواندن علمی با در دسترستر کردن و محتوایی غنیتر. [12] Semantic Reader کارتهای استناد درون خطی را ارائه میکند که به کاربران امکان میدهد نقلقولها را با TLDR (مخفف Too Long, Didn't Read) مشاهده کنند که به طور خودکار خلاصههای کوتاهی را هنگام خواندن و مرور نکات برجسته ایجاد میکند که نکات کلیدی یک مقاله را ثبت میکند تا کاربران بتوانند بتوانند سریعتر هضم شود
بر خلاف Google Scholar و PubMed ، Semantic Scholar برای برجسته کردن مهمترین و تأثیرگذارترین عناصر یک مقاله طراحی شده است. [13] فناوری هوش مصنوعی برای شناسایی ارتباطات و پیوندهای پنهان بین موضوعات تحقیقاتی طراحی شده است. [14] مانند موتورهای جستجوی ذکر شده قبلی، Semantic Scholar از ساختارهای گراف نیز بهره برداری می کند، که شامل نمودار دانش آکادمیک مایکروسافت ، SciGraph Springer Nature ، و Semantic Scholar Corpus (در اصل مجموعه 45 میلیون مقاله در علوم کامپیوتر، علوم اعصاب و زیست پزشکی) است. [15] [16]
به هر مقاله ای که توسط Semantic Scholar میزبانی می شود، یک شناسه منحصر به فرد به نام Semantic Scholar Corpus ID (به اختصار S2CID) اختصاص داده می شود. ورودی زیر یک نمونه است:
لیو، یانگ؛ گیل، آلبرت ا. وایلدر اسمیت، آنلیز; Rocklöv, Joacim (مارس 2020). «تعداد تولیدمثلی COVID-19 در مقایسه با ویروس سارس بیشتر است». مجله پزشکی مسافرتی . 27 (2). doi :10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.
Semantic Scholar برای استفاده رایگان است و برخلاف موتورهای جستجوی مشابه (به عنوان مثال Google Scholar ) مطالبی را که در پشت دیوار پرداخت هستند جستجو نمی کند . [5] [ نیاز به نقل قول ]
یک مطالعه دامنه شاخص Semantic Scholar را با Google Scholar مقایسه کرد و دریافت که برای مقالاتی که توسط مطالعات ثانویه در علوم کامپیوتر به آنها استناد شده است، این دو شاخص پوشش قابل مقایسه ای داشتند و هر کدام تنها تعداد انگشت شماری از مقالات را از دست دادند. [17]
از ژانویه 2018، به دنبال پروژه ای در سال 2017 که مقالات زیست پزشکی و خلاصه موضوعات را اضافه کرد، مجموعه Semantic Scholar شامل بیش از 40 میلیون مقاله از علوم کامپیوتر و زیست پزشکی بود . [18] در مارس 2018، داگ ریموند، که ابتکارات یادگیری ماشینی را برای پلتفرم آمازون الکسا توسعه داد ، برای رهبری پروژه Semantic Scholar استخدام شد. [19] تا اوت 2019 [به روز رسانی]، تعداد فرادادههای مقالات (و نه فایلهای PDF واقعی) پس از اضافه شدن رکوردهای نمودار آکادمیک مایکروسافت به بیش از 173 میلیون [20] افزایش یافت . [21] در سال 2020، مشارکت بین Semantic Scholar و مجلههای مطبوعاتی دانشگاه شیکاگو، همه مقالات منتشر شده تحت انتشارات دانشگاه شیکاگو را در مجموعه Semantic Scholar در دسترس قرار داد. [22] در پایان سال 2020، Semantic Scholar 190 میلیون مقاله را نمایه کرده بود. [23] در سال 2020، Semantic Scholar به هفت میلیون کاربر در ماه رسید. [7]
... مجموعه در دسترس عموم گردآوری شده توسط Semantic Scholar - ابزاری که در سال 2015 توسط مؤسسه آلن برای هوش مصنوعی در سیاتل، واشنگتن راه اندازی شد - حدود 200 میلیون مقاله، از جمله پیش چاپ.