stringtranslate.com

تقسیم کننده کلمه

در نشانه گذاری ، تقسیم کننده کلمه شکلی از گلیف است که کلمات نوشته شده را از هم جدا می کند . در زبان‌هایی که از الفبای لاتین ، سیریلیک و عربی و همچنین دیگر خط‌های اروپا و آسیای غربی استفاده می‌کنند، کلمه تقسیم کننده یک فضای خالی یا فضای سفید است . این کنوانسیون، همراه با دیگر جنبه‌های نقطه‌گذاری اروپایی، در آسیا و آفریقا در حال گسترش است، جایی که کلمات معمولاً بدون جداسازی کلمات نوشته می‌شوند. [1] [ منبع بهتر مورد نیاز است ]

در رمزگذاری کاراکتر ، تقسیم بندی کلمات به این بستگی دارد که کدام کاراکترها به عنوان تقسیم کننده کلمات تعریف شوند.

تاریخچه

در مصر باستان ، ممکن است از تعیین کننده ها به همان اندازه برای تعیین مرزهای کلمات استفاده شده باشد تا معنای ابهام زدایی از کلمات. [2] به ندرت در خط میخی آشوری ، اما معمولاً در الفبای اوگاریتی خط میخی متأخر ، از خط عمودی 💑 برای جداسازی کلمات استفاده می شد. در خط میخی پارسی قدیم از گوه ای با شیب مورب استفاده می شد. [3]

همانطور که الفبا در سراسر جهان باستان گسترش یافت، کلمات اغلب بدون تقسیم با هم اجرا می شدند و این عمل تا همین اواخر در بسیاری از جنوب و جنوب شرقی آسیا باقی مانده یا باقی مانده است. با این حال، نه به ندرت در کتیبه ها یک خط عمودی، و در نسخه های خطی یک (·)، دو (:)، یا سه (⫶) (⫶) متقابل (نقطه) برای تقسیم کلمات استفاده می شد. این عمل در زبان‌های فنیقی ، آرامی ، عبری ، یونانی و لاتین یافت شد و امروزه با اتیوپی ادامه می‌یابد ، اگرچه فضای خالی در آنجا بیشتر می‌شود.

Scriptio Continua

سیستم‌های نوشتاری الفبایی اولیه ، مانند الفبای فنیقی ، فقط نشانه‌هایی برای صامت‌ها داشتند (اگرچه برخی از نشانه‌ها برای همخوان‌ها می‌توانستند مصوت نیز باشند ، به اصطلاح matres lectionis ). بدون نوعی از تقسیم‌کننده‌های کلمه قابل مشاهده، تجزیه یک متن به کلمات جداگانه آن یک معما بود. با معرفی حروف نشان دهنده حروف صدادار در الفبای یونانی ، نیاز به جداسازی بین کلمات کاهش یافت. قدیمی‌ترین کتیبه‌های یونانی از حروف متقابل استفاده می‌کردند، همانطور که در سیستم‌های نوشتاری پیش از آن رایج بود، اما به زودی تمرین scriptio continua ، نوشتن پیوسته که در آن همه کلمات بدون جدایی با هم ترکیب می‌شدند رایج شد.

انواع

هیچ کدام

حروف الفبای بدون جداسازی بین کلمه ای که به scriptio continua معروف است در مصر باستان استفاده می شد. پس از چندین قرن استفاده از interpunct در لاتین پس از کلاسیک ظاهر شد.

به طور سنتی، scriptio continua برای الفبای هندی آسیای جنوبی و جنوب شرقی و هانگول کره استفاده می‌شد ، اما اکنون فاصله با هانگول و به طور فزاینده‌ای با الفبای هندی استفاده می‌شود.

امروزه چینی و ژاپنی پرکاربردترین خط‌هایی هستند که به طور مداوم بدون علامت نگارش برای جدا کردن کلمات نوشته می‌شوند، اگرچه خط‌های دیگر مانند تایلندی و لائوس نیز از این قرارداد نوشتن پیروی می‌کنند. در چینی کلاسیک، یک کلمه و یک کاراکتر تقریباً یکسان بودند، بنابراین تقسیم‌کننده‌های کلمات اضافی می‌بودند. اگرچه ماندارین مدرن دارای کلمات چند هجای متعددی است و هر هجا با یک کاراکتر متمایز نوشته شده است، پیوند مفهومی بین کاراکتر و کلمه یا حداقل تکواژ همچنان قوی است و نیازی به جداسازی کلمات جدا از آنچه کاراکترها قبلا ارائه می‌دهند احساس نمی‌شود. این پیوند به زبان ویتنامی نیز یافت می شود . با این حال، در الفبای ویتنامی ، تقریباً همه هجاها با فاصله از هم جدا می شوند، چه مرزهای کلمه را تشکیل دهند یا نه.

نمونه ای از خط جاوه ای ادامه ماده اول اعلامیه حقوق بشر.

فضا

Space رایج ترین تقسیم کننده کلمه است، به خصوص در خط لاتین .

نمونه های فاصله گذاری سنتی از کتابچه راهنمای سبک شیکاگو در سال 1911 [4]

خطوط عمودی

خط های کتیبه ای و میخی باستانی مانند هیروگلیف های آناتولی اغلب از خطوط عمودی کوتاه برای جداسازی کلمات استفاده می کردند، مانند خط B. در نسخه‌های خطی، خطوط عمودی بیشتر برای شکست‌های بزرگ‌تر، معادل کاما و نقطه لاتین استفاده می‌شد. این مورد در مورد عبری کتاب مقدس ( paseq ) بود و امروزه با بسیاری از خط‌های هندی ( داندا ) ادامه می‌یابد.

Interpunct، چند نقطه و هیپودیاستول

تعامل دوگانه اتیوپی

همانطور که در بالا ذکر شد، تک و دو نقطه متقابل در نسخه های خطی (روی کاغذ) در سراسر جهان باستان استفاده می شد. به عنوان مثال، کتیبه های اتیوپی از یک خط عمودی استفاده می کردند، در حالی که نسخه های خطی از دو نقطه (፡) شبیه دو نقطه استفاده می کردند. تمرین اخیر امروز نیز ادامه دارد، اگرچه فضا در حال نفوذ است. لاتین کلاسیک از interpunct هم در دست نوشته های کاغذی و هم در کتیبه های سنگی استفاده می کرد. [5] املای یونان باستان بین دو تا پنج نقطه به عنوان جداکننده کلمات و همچنین هیپودیاستول استفاده می شد .

اشکال مختلف حروف

در الفبای عبری و عربی امروزی ، برخی از حروف دارای اشکال متمایز در انتهای و/یا ابتدای کلمات هستند. این مرزبندی علاوه بر فاصله گذاری استفاده می شود.

آرایش عمودی

نستعلیق برای اردو (نوشته شده از راست به چپ) استفاده می شود

خط نستعلیق در رسم الخط اسلامی از آرایش عمودی برای جداسازی کلمات استفاده می کند. ابتدای هر کلمه بالاتر از انتهای کلمه قبل نوشته می شود، به طوری که یک خط از متن ظاهر دندان اره ای به خود می گیرد . نستعلیق از ایران گسترش یافته و امروزه برای فارسی ، اویغور ، پشتو و اردو استفاده می شود .

مکث کنید

در املای انگشتی و در کد مورس ، کلمات با مکث از هم جدا می شوند.

یونیکد

برای استفاده با رایانه، این علامت ها دارای نقاط کد در یونیکد هستند :

در اسکریپت خطی B :

همچنین ببینید

مراجع

  1. ^ (سنگر 2000)
  2. «تعریف‌ها مهم‌ترین کمکی به خوانایی هستند، زیرا جداکننده‌های کلمات به راحتی قابل شناسایی هستند». (Ritner 1996:77)
  3. کینگ، لئونارد ویلیام (1901). خط میخی آشوری . نیویورک: AMS Press. ص 42.
  4. انتشارات دانشگاه شیکاگو (1911). کتابچه راهنمای سبک: مجموعه ای از قوانین تایپوگرافی حاکم بر انتشارات دانشگاه شیکاگو، با نمونه هایی از انواع مورد استفاده در انتشارات دانشگاه (ویرایش سوم). شیکاگو: دانشگاه شیکاگو. ص 101. این خط فاصله دارد.
  5. ^ (Wingo 1972:16)

در ادامه مطلب