stringtranslate.com

ویکیواژه

ویکیواژه ( انگلستان : / ˈ w ɪ k ʃ ən ər i / ،WIK-shə-nər-ee;ایالات متحده:/ ˈ w ɪ k ʃ ə n ɛr i / ،WIK-shə-nerr-ee; قافیه با "فرهنگ") یک پروژه چند زبانه ووببرای ایجادفرهنگ لغتمحتوای رایگان از اصطلاحات (شاملکلمات،عبارات،ضرب المثل ها،بازسازی های زبانیو غیره) در همهزبان های طبیعیو در تعدادی اززبان های مصنوعی. این مدخل ها ممکن است شاملتعاریف،تصاویربرای تصویرسازی،تلفظ ها،ریشه شناسی ها،عطف ها، مثال های استفاده،نقل قول ها، اصطلاحات مرتبط، وترجمهاصطلاحات به زبان های دیگر و سایر ویژگی ها باشد. ایناز طریقویکیویرایش. نام آنبرگرفتهاز کلماتویکیودیکشنری.زبان انگلیسی سادهموجود است.ویکی‌واژهمانند پروژه خواهر خودبنیاد ویکی‌مدیااداره می‌شودو به‌طور مشترک توسطداوطلبانکه «ویکی‌واژه‌نویسان» نام دارند.نرم‌افزار ویکیآن،MediaWiki، تقریباً به هر کسی که به وب‌سایت دسترسی دارد اجازه می‌دهد تا مدخل‌هایی ایجاد و ویرایش کند.

از آنجایی که ویکی‌واژه با ملاحظات فضای چاپی محدود نمی‌شود، اکثر نسخه‌های زبان ویکی‌واژه تعاریف و ترجمه‌هایی از اصطلاحات را از زبان‌های بسیاری ارائه می‌کنند، و برخی از نسخه‌ها اطلاعات بیشتری را معمولاً در اصطلاحنامه‌ها ارائه می‌دهند .

داده‌های ویکی‌واژه اغلب در کارهای مختلف پردازش زبان طبیعی استفاده می‌شوند.

تاریخ و توسعه

ویکی‌واژه در 12 دسامبر 2002، [2] پس از پیشنهاد دانیل آلستون و ایده‌ای توسط لری سانگر ، یکی از بنیان‌گذاران ویکی‌پدیا، به صورت آنلاین عرضه شد. [3] در 28 مارس 2004، اولین ویکیواژه نامه های غیر انگلیسی به زبان های فرانسوی و لهستانی راه اندازی شد . ویکی‌واژه‌ها به بسیاری از زبان‌های دیگر از آن زمان آغاز شده‌اند. ویکی‌واژه تا 1 می 2004 بر روی یک نام دامنه موقت (wiktionary.wikipedia.org) میزبانی می‌شد ، زمانی که به نام دامنه فعلی تغییر کرد. [a] از جولای 2021 ، ویکی‌واژه دارای بیش از 30 میلیون مقاله (و حتی ورودی‌های بیشتر) در نسخه‌های خود است. [4] بزرگ‌ترین نسخه‌های زبان ویکی‌واژه انگلیسی با بیش از 7.5 میلیون مدخل، پس از آن ویکی‌واژه فرانسوی با بیش از 4.7 میلیون و ویکی‌واژه مالاگاسی با بیش از 3.5 میلیون مدخل قرار دارند. چهل و سه نسخه به زبان ویکی‌واژه شامل بیش از 100000 مدخل هستند. [ب]

استفاده از ربات‌ها برای تولید تعداد زیادی مقاله به‌عنوان «جهش‌های رشد» در این نمودار از تعداد مقالات در هشت نسخه بزرگ ویکی‌واژه قابل مشاهده است. (داده ها از دسامبر 2009 )

بسیاری از تعاریف در بزرگترین نسخه‌های زبان پروژه توسط ربات‌هایی ایجاد شده‌اند که راه‌های خلاقانه‌ای برای تولید مدخل پیدا می‌کنند یا (به ندرت) هزاران مدخل را به‌طور خودکار از دیکشنری‌های منتشر شده قبلی وارد می‌کنند. هفت ربات از 18 ربات ثبت شده در ویکیواژه انگلیسی در سال 2007 [c] 163000 مدخل را در آنجا ایجاد کردند. [5]

یکی دیگر از این ربات‌ها، "ThirdPersBot"، مسئول افزودن تعدادی صیغه سوم شخص بود که مدخل‌های خود را در لغت‌نامه‌های استاندارد دریافت نمی‌کردند. به عنوان مثال، «اسمولدرز» را به عنوان «شکل امروزی ساده سوم شخص مفرد از دود» تعریف کرد. از 1,269,938 تعریفی که ویکی‌واژه انگلیسی برای 996,450 کلمه انگلیسی ارائه می‌کند, 478,068 تعاریف "شکل" از این نوع هستند. [6] این بدان معنی است که حتی بدون چنین مدخل هایی، پوشش انگلیسی آن به طور قابل توجهی بیشتر از فرهنگ لغت نامه های چاپی تک زبانه اصلی است. به عنوان مثال، سومین دیکشنری جدید بین المللی زبان انگلیسی مریام وبستر ، خلاصه نشده ، دارای 475000 مدخل (با بسیاری از سر واژه های جاسازی شده اضافی) است. فرهنگ لغت انگلیسی آکسفورد دارای 615000 کلمه اصلی است، اما شامل انگلیسی میانه نیز می‌شود، که ویکی‌واژه انگلیسی دارای 34234 تعریف براق اضافی است. آمار دقیق برای نشان دادن تعداد ورودی های انواع مختلف وجود دارد.

ویکی‌واژه انگلیسی در حدی که برخی نسخه‌های دیگر به ربات‌ها متکی هستند، نیست. برای مثال، ویکی‌واژه‌های فرانسوی و ویتنامی ، بخش‌های بزرگی از پروژه فرهنگ لغت ویتنامی رایگان (FVDP) را وارد کردند ، که فرهنگ‌های دوزبانه محتوای رایگان را به ویتنامی و از ویتنامی ارائه می‌کند . [d] این ورودی‌های وارداتی تقریباً تمام محتوای نسخه ویتنامی را تشکیل می‌دهند. مانند نسخه انگلیسی، ویکی‌واژه فرانسوی تقریباً 20000 مدخل از پایگاه داده Unihan با حروف چینی، ژاپنی، کره‌ای و هندی وارد کرده است . ویکی‌واژه فرانسوی در سال 2006 به سرعت رشد کرد، تا حد زیادی به لطف روبات‌هایی که بسیاری از مدخل‌ها را از فرهنگ‌های قدیمی و دارای مجوز آزاد کپی می‌کردند، مانند ویرایش هشتم Dictionnaire de l'Académie française (1935، حدود 35000 کلمه)، و از ربات‌ها برای افزودن استفاده می‌کردند. کلماتی از سایر نسخه‌های ویکی‌واژه با ترجمه‌های فرانسوی. نسخه روسی نزدیک به 80000 مدخل افزایش یافت زیرا "LXbot" ورودی های دیگ بخاری (با عنوان، اما بدون تعاریف) برای کلمات به زبان انگلیسی و آلمانی اضافه کرد . [7]

از جولای 2021، ویکی‌واژه انگلیسی دارای بیش از 791,870 تعریف براق و بیش از 1,269,938 کل تعاریف (شامل اشکال مختلف) برای مدخل‌های انگلیسی است که در مجموع بیش از 9,928,056 تعریف در همه زبان‌ها وجود دارد. [8]

لوگوها

ویکی‌واژه از لحاظ تاریخی فاقد لوگوی یکنواخت در سراسر نسخه‌های زبانی متعدد خود بوده است. برخی از نسخه‌ها از آرم‌هایی استفاده می‌کنند که یک مدخل فرهنگ لغت درباره اصطلاح «ویکی‌واژه» را بر اساس لوگوی قبلی ویکی‌واژه انگلیسی، که توسط بروک وایبر، توسعه‌دهنده مدیاویکی طراحی شده بود، نشان می‌دهند . [9] از آنجایی که یک لوگوی صرفاً متنی باید از زبانی به زبان دیگر به طور قابل توجهی متفاوت باشد، یک مسابقه چهار مرحله ای برای اتخاذ یک آرم یکسان در ویکی مدیا متا ویکی از سپتامبر تا اکتبر 2006 برگزار شد. [e] برخی از جوامع مدخل برنده را توسط "Smurrayinchester"، شبکه ای 3×3 از کاشی های چوبی، که هر کدام دارای شخصیتی از یک سیستم نوشتاری متفاوت است. با این حال، در این نظرسنجی آنچنان که برخی از اعضای انجمن امیدوار بودند، مشارکت جامعه ویکی‌واژه مشاهده نشد، و تعدادی از ویکی‌های بزرگ‌تر در نهایت آرم متنی خود را حفظ کردند. [e]

در آوریل 2009، این شماره با یک مسابقه جدید دوباره زنده شد. این بار، تصویری توسط "AAEngelman" از یک فرهنگ لغت با سخت‌افزار باز، رای رو به رو علیه لوگوی سال 2006 به دست آورد، اما روند اصلاح و پذیرش لوگوی جدید متوقف شد. [10] در سال‌های بعد، برخی از ویکی‌ها لوگوهای متنی خود را با یکی از دو نشان‌واره جدید جایگزین کردند. در سال 2012، 55 ویکی که از لوگوی ویکی‌واژه انگلیسی استفاده می‌کردند، نسخه‌های بومی‌سازی شده طرح سال 2006 توسط "Smurrayinchester" را دریافت کردند. [f] در ژوئیه ۲۰۱۶، ویکی‌واژه انگلیسی گونه‌ای از این لوگو را پذیرفت. [11] تا 4 ژوئیه 2016 ، 135 ویکی، که 61% از مدخل های ویکیواژه را تشکیل می دهند، از لوگویی بر اساس طرح سال 2006 توسط "Smurrayinchester"، 33 ویکی (36٪) از یک نشان متنی و سه ویکی (3٪) استفاده می کنند. از طرح 2009 توسط "AAEngelman" استفاده کنید. [12]

چند زبانه

از اکتبر 2024، سایت‌های ویکی‌واژه برای 194 زبان وجود دارد که 170 زبان فعال و 24 زبان بسته شده‌اند. [1] سایت های فعال دارای 41,609,944 مقاله و سایت های بسته دارای 339 مقاله هستند. [13] 7,384,900 کاربر ثبت نام شده وجود دارد که 6015 نفر آنها اخیراً فعال هستند. [13]

ده پروژه برتر زبان ویکی‌واژه بر اساس تعداد مقاله‌های فضای اصلی: [13]

برای فهرست کامل با کل آمار ویکی‌مدیا را ببینید: [14]

پذیرش انتقادی

استقبال انتقادی از ویکیواژه متفاوت بوده است. در سال 2006، جیل لپور در مقاله "کشتی نوح" برای نیویورکر نوشت ، [g]

در ویکی‌واژه خبری از دست بالا نیست . حتی یک تحریریه هم وجود ندارد. شاید شعار ویکی‌واژه باشد: «لغت‌نویس خودت باش!» چه کسی به متخصص نیاز دارد؟ چرا پول خوبی برای دیکشنری که توسط فرهنگ نویسان نوشته شده است بپردازیم در حالی که خودمان می توانیم آن را با هم بسازیم؟

ویکی‌واژه آنقدر جمهوری‌خواهانه یا دموکراتیک نیست که مائوئیستی است . و فقط به اندازه کتابهای منقضی شده با حق چاپ که از آنها سرقت می کند خوب است .

نقد Keir Graff برای Booklist کمتر انتقادی بود:

آیا جایی برای ویکیواژه وجود دارد؟ بدون شک. صنعت و اشتیاق بسیاری از سازندگان آن گواه بر وجود بازار است. و داشتن یک منبع قوی دیگر برای استفاده در هنگام جستجوی عبارات عجیب و غریبی که در دنیای در حال تغییر امروز و محیط آنلاین ظاهر می شوند، فوق العاده است. اما مانند بسیاری از منابع وب (از جمله این ستون)، بهترین استفاده از آن توسط کاربران پیشرفته در ارتباط با منابع معتبرتر است. [ نیازمند منبع ]

ارجاعات در نشریات دیگر زودگذر است و بخشی از بحث های بزرگتر ویکی پدیا است و فراتر از یک تعریف پیشرفت نمی کند، اگرچه دیوید بروکس در The Nashua Telegraph آن را "وحشی و پشمالو" توصیف کرد. [16] یکی از موانع پوشش مستقل ویکی‌واژه، سردرگمی مداوم است که آن را صرفاً توسعه‌ای از ویکی‌پدیا است. [h]

اندازه گیری صحت عطف برای زیرمجموعه ای از کلمات لهستانی در ویکیواژه انگلیسی نشان داد که این داده های دستوری بسیار پایدار است (یک مطالعه نشان داد که از 4748 کلمه لهستانی فقط 131 کلمه عطف آنها تصحیح شده است). [17]

از سال 2016 ، ویکی‌واژه شاهد استفاده رو به رشدی در دانشگاه بوده است . [18]

داده‌های ویکی‌واژه در پردازش زبان طبیعی

ویکی‌واژه دارای داده‌های نیمه ساختاریافته است . [19] داده‌های واژگانی ویکی‌واژه را می‌توان به قالب قابل خواندن ماشین تبدیل کرد تا در کارهای پردازش زبان طبیعی استفاده شود . [20] [21] [22]

داده کاوی ویکیواژه یک کار پیچیده است. مشکلات زیر وجود دارد: [23]

تجزیه کننده های متعددی برای نسخه های مختلف زبان ویکیواژه وجود دارد : [24]

نمونه هایی از وظایف پردازش زبان طبیعی که با کمک داده های ویکیواژه حل شده اند عبارتند از:

« ویکی‌داده : داده‌های واژگانی» در سال ۲۰۱۸ برای ارائه پشتیبانی از داده‌های ساختاریافته برای ویکی‌واژه‌ها آغاز شد. این داده های کلمه همه زبان ها را در یک مدل داده قابل خواندن توسط ماشین، تحت فضای نام اختصاصی " Lexeme " در ویکی داده ذخیره می کند. از اکتبر 2021، این پروژه بیش از 600000 مدخل واژه‌نامه از زبان‌های مختلف را جمع‌آوری کرده است. [47]

همچنین ببینید

یادداشت ها

  1. ^ آدرس فعلی ویکی‌واژه www.wiktionary.org است
  2. ^ تعداد کل مقالات ویکیواژه اینجاست. آمار دقیق بر اساس نوع کلمه در اینجا موجود است [1].
  3. ^ فهرست کاربران در ویکی‌واژه انگلیسی، حساب‌هایی را شناسایی می‌کند که به آنها "وضعیت ربات" داده شده است.
  4. ^ Hồ Ngọc Đức، پروژه فرهنگ لغت ویتنامی رایگان. جزئیات در ویکی‌واژه ویتنامی.
  5. ^ ab "ویکیواژه/نگو"، متا ویکی، بنیاد ویکی مدیا .
  6. ^ [Translators-l] 56 ویکی‌واژه‌ها یک نشان‌واره محلی دریافت کردند
  7. ^ مقاله کامل به صورت آنلاین در دسترس نیست. [15]
  8. ^ در این نقل قول، نویسنده به ویکی‌واژه به عنوان بخشی از سایت ویکی‌پدیا اشاره می‌کند: برگرفته از مقاله نائومی دی تولیو (2006). "ویکی برای کتابداران" (PDF) . NETLS News #142 . سیستم کتابخانه شمال شرقی تگزاس ص 15. بایگانی شده از اصل (خبرنامه PDF) در 5 ژوئن 2007 . بازیابی شده در 21 آوریل 2007 .
  9. ^ به عنوان مثال ساختار ورودی و قوانین قالب بندی را در ویکیواژه انگلیسی و ویکیواژه روسی مقایسه کنید.
  10. ^ نقل قول ها فقط از ویکیواژه روسی استخراج شده اند. [33]
  11. ^ اگر چندین نماد IPA در یک صفحه ویکی‌واژه وجود داشته باشد - چه برای زبان‌های مختلف یا برای انواع تلفظ، اولین تلفظ استخراج شد. [39]
  12. ^ کد منبع و نتایج برچسب‌گذاری POS در https://code.google.com/p/wikily-supervised-pos-tagger موجود است

مراجع

نقل قول ها

  1. ^ ab Wikimedia 's MediaWiki API:Sitematrix. در اکتبر 2024 از Data:Wikipedia statistics/meta.tab بازیابی شده است
  2. «بحث بایگانی فهرست پستی ویکی‌پدیا که افتتاح پروژه ویکی‌واژه را اعلام می‌کند». 12 دسامبر 2002. بایگانی شده از نسخه اصلی در 20 ژوئن 2014 . بازیابی شده در 3 مه 2011 .
  3. بحث بایگانی فهرست پستی ویکی‌پدیا از لری سانگر که این ایده را در ویکی‌واژه ارائه کرده است. بایگانی‌شده در ۲۰ ژوئن ۲۰۱۴، در Wayback Machine – بازیابی شده در ۳ می ۲۰۱۱
  4. «ویکیواژه». www.wiktionary.org ​بایگانی شده از نسخه اصلی در 13 سپتامبر 2008 . بازبینی شده در 28 اکتبر 2021 .
  5. TheDaveBot بایگانی‌شده در ۱۱ اکتبر ۲۰۰۷، در Wayback Machine ، TheCheatBot بایگانی‌شده در ۱۱ اکتبر ۲۰۰۷، در Wayback Machine ، Websterbot بایگانی‌شده در ۱۱ اکتبر ۲۰۰۷، در Wayback Machine ، PastBot بایگانی‌شده در اکتبر 17، NBot در Wayback Machines ، 2007 بایگانی شده در 11 اکتبر 2007، در Wayback Machine
  6. ^ آمار تفصیلی آرشیو شده در 23 ژوئیه 2021، در Wayback Machine تا 21 ژوئیه 2021
  7. "LXbot". بایگانی شده از نسخه اصلی در 24 مه 2008.
  8. «ویکی‌واژه: آمار». 29 مارس 2022. بایگانی شده از نسخه اصلی در 6 مارس 2023 . بازبینی شده در ۶ مارس ۲۰۲۳ – از طریق ویکی‌واژه.
  9. «گفتگوی ویکی‌واژه: لوگوی ویکی‌واژه»، ویکی‌واژه انگلیسی، بنیاد ویکی‌مدیا.
  10. «ویکی‌واژه/لوگو/رفرش/رای‌گیری»، متا ویکی، بنیاد ویکی‌مدیا.
  11. ^ phab: T139255
  12. ^ m:ویکی‌واژه/آرم#آمار استفاده از لوگو.
  13. ^ abc API مدیاویکی ویکی‌مدیا : Siteinfo . در اکتبر 2024 از Data:Wikipedia statistics/data.tab بازیابی شده است
  14. «آمار ویکی‌واژه». Meta.Wikimedia.org ​بایگانی شده از نسخه اصلی در 2 سپتامبر 2020 . بازیابی شده در 11 سپتامبر 2020 .
  15. ^ لپور 2006.
  16. دیوید بروکس، "دانشنامه آنلاین و تعاملی دیگر فقط برای گیک ها نیست، زیرا به نظر می رسد همه اکنون، بیشتر از همیشه به آن نیاز دارند!" The Nashua Telegraph (4 اوت 2004)
  17. کورماس 2010.
  18. ساشا و مولر اسپیتزر 2016، ص. 348
  19. ^ مایر و گوریویچ 2012، ص. 140.
  20. Zesch, Müller & Gurevych 2008, p. 4، شکل 1.
  21. ^ مایر و گوریویچ 2010، ص. 40.
  22. کریژانوفسکی، تحول 2010، ص. 1.
  23. ^ Hellmann & Auer 2013, p. 302، ص. 16 در PDF.
  24. هلمن، برکل و اوئر 2012، ص. 3، جدول 1.
  25. «ویکیواژه DBpedia». بایگانی شده از نسخه اصلی در 4 مه 2013.
  26. Hellmann, Brekle & Auer 2012, pp. 8-9.
  27. هلمن، برکل و اوئر 2012، ص. 10.
  28. هلمن، برکل و اوئر 2012، ص. 11.
  29. ^ "خوش آمدید". DKPro JWKTL . بایگانی‌شده از نسخه اصلی در ۲۳ ژانویه ۲۰۲۱ . بازبینی شده در 23 ژوئن 2019 .
  30. زش، مولر و گوریویچ 2008.
  31. «Wikokit - ویکی‌واژه‌نامه قابل خواندن توسط ماشین». 19 دسامبر 2022. بایگانی شده از نسخه اصلی در 2 اکتبر 2020 . بازیابی شده در 7 نوامبر 2015 - از طریق GitHub.
  32. کریژانوفسکی، تحول 2010.
  33. ^ آب اسمیرنوف و همکاران. 2012.
  34. کریژانوفسکی، مقایسه 2010.
  35. «تحقیق جرارد دی ملو در ICSI، برکلی». gerard.demelo.org . بایگانی‌شده از نسخه اصلی در ۲۷ مارس ۲۰۲۳ . بازبینی شده در 6 مارس 2023 .
  36. Otte & Tyers 2011.
  37. McFate & Forbus 2011.
  38. Schlippe، Ochs & Schultz 2012.
  39. ^ Schlippe, Ochs & Schultz 2012, p. 4802.
  40. ^ Schlippe, Ochs & Schultz 2012, p. 4804.
  41. مایر و گورویچ 2012.
  42. «ConceptNet 5». conceptnet5.media.mit.edu . بایگانی شده از نسخه اصلی در 19 اکتبر 2011 . بازبینی شده در 23 سپتامبر 2023 .
  43. لین و کریژانوفسکی 2011.
  44. مدرو و اوستندورف 2009.
  45. لی، گراچا و تاسکار 2012.
  46. ^ چسلی و همکاران 2006.
  47. «ویکی داده:ویکیواژه». بایگانی شده از نسخه اصلی در 3 ژانویه 2023 . بازیابی شده در 12 اکتبر 2012 .

منابع

لینک های خارجی