در نشانه گذاری ، تقسیم کننده کلمه شکلی از گلیف است که کلمات نوشته شده را از هم جدا می کند . در زبانهایی که از الفبای لاتین ، سیریلیک و عربی و همچنین دیگر خطهای اروپا و آسیای غربی استفاده میکنند، کلمه تقسیم کننده یک فضای خالی یا فضای سفید است . این کنوانسیون، همراه با دیگر جنبههای نقطهگذاری اروپایی، در آسیا و آفریقا در حال گسترش است، جایی که کلمات معمولاً بدون جداسازی کلمات نوشته میشوند. [1] [ منبع بهتر مورد نیاز است ]
در رمزگذاری کاراکتر ، تقسیم بندی کلمات به این بستگی دارد که کدام کاراکترها به عنوان تقسیم کننده کلمات تعریف شوند.
در مصر باستان ، ممکن است از تعیین کننده ها به همان اندازه برای تعیین مرزهای کلمات استفاده شده باشد تا معنای ابهام زدایی از کلمات. [2] به ندرت در خط میخی آشوری ، اما معمولاً در الفبای اوگاریتی خط میخی متأخر ، از خط عمودی 💑 برای جداسازی کلمات استفاده می شد. در خط میخی پارسی قدیم از گوه ای با شیب مورب استفاده می شد. [3]
همانطور که الفبا در سراسر جهان باستان گسترش یافت، کلمات اغلب بدون تقسیم با هم اجرا می شدند و این عمل تا همین اواخر در بسیاری از جنوب و جنوب شرقی آسیا باقی مانده یا باقی مانده است. با این حال، نه به ندرت در کتیبه ها یک خط عمودی، و در نسخه های خطی یک (·)، دو (:)، یا سه (⫶) (⫶) متقابل (نقطه) برای تقسیم کلمات استفاده می شد. این عمل در زبانهای فنیقی ، آرامی ، عبری ، یونانی و لاتین یافت شد و امروزه با اتیوپی ادامه مییابد ، اگرچه فضای خالی در آنجا بیشتر میشود.
سیستمهای نوشتاری الفبایی اولیه ، مانند الفبای فنیقی ، فقط نشانههایی برای صامتها داشتند (اگرچه برخی از نشانهها برای همخوانها میتوانستند مصوت نیز باشند ، به اصطلاح matres lectionis ). بدون نوعی از تقسیمکنندههای کلمه قابل مشاهده، تجزیه یک متن به کلمات جداگانه آن یک معما بود. با معرفی حروف نشان دهنده حروف صدادار در الفبای یونانی ، نیاز به جداسازی بین کلمات کاهش یافت. قدیمیترین کتیبههای یونانی از حروف متقابل استفاده میکردند، همانطور که در سیستمهای نوشتاری پیش از آن رایج بود، اما به زودی تمرین scriptio continua ، نوشتن پیوسته که در آن همه کلمات بدون جدایی با هم ترکیب میشدند رایج شد.
حروف الفبای بدون جداسازی بین کلمه ای که به scriptio continua معروف است در مصر باستان استفاده می شد. پس از چندین قرن استفاده از interpunct در لاتین پس از کلاسیک ظاهر شد.
به طور سنتی، scriptio continua برای الفبای هندی آسیای جنوبی و جنوب شرقی و هانگول کره استفاده میشد ، اما اکنون فاصله با هانگول و به طور فزایندهای با الفبای هندی استفاده میشود.
امروزه چینی و ژاپنی پرکاربردترین خطهایی هستند که به طور مداوم بدون علامت نگارش برای جدا کردن کلمات نوشته میشوند، اگرچه خطهای دیگر مانند تایلندی و لائوس نیز از این قرارداد نوشتن پیروی میکنند. در چینی کلاسیک، یک کلمه و یک کاراکتر تقریباً یکسان بودند، بنابراین تقسیمکنندههای کلمات اضافی میبودند. اگرچه ماندارین مدرن دارای کلمات چند هجای متعددی است و هر هجا با یک کاراکتر متمایز نوشته شده است، پیوند مفهومی بین کاراکتر و کلمه یا حداقل تکواژ همچنان قوی است و نیازی به جداسازی کلمات جدا از آنچه کاراکترها قبلا ارائه میدهند احساس نمیشود. این پیوند به زبان ویتنامی نیز یافت می شود . با این حال، در الفبای ویتنامی ، تقریباً همه هجاها با فاصله از هم جدا می شوند، چه مرزهای کلمه را تشکیل دهند یا نه.
Space رایج ترین تقسیم کننده کلمه است، به خصوص در خط لاتین .
خط های کتیبه ای و میخی باستانی مانند هیروگلیف های آناتولی اغلب از خطوط عمودی کوتاه برای جداسازی کلمات استفاده می کردند، مانند خط B. در نسخههای خطی، خطوط عمودی بیشتر برای شکستهای بزرگتر، معادل کاما و نقطه لاتین استفاده میشد. این مورد در مورد عبری کتاب مقدس ( paseq ) بود و امروزه با بسیاری از خطهای هندی ( داندا ) ادامه مییابد.
همانطور که در بالا ذکر شد، تک و دو نقطه متقابل در نسخه های خطی (روی کاغذ) در سراسر جهان باستان استفاده می شد. به عنوان مثال، کتیبه های اتیوپی از یک خط عمودی استفاده می کردند، در حالی که نسخه های خطی از دو نقطه (፡) شبیه دو نقطه استفاده می کردند. تمرین اخیر امروز نیز ادامه دارد، اگرچه فضا در حال نفوذ است. لاتین کلاسیک از interpunct هم در دست نوشته های کاغذی و هم در کتیبه های سنگی استفاده می کرد. [5] املای یونان باستان بین دو تا پنج نقطه به عنوان جداکننده کلمات و همچنین هیپودیاستول استفاده می شد .
در الفبای عبری و عربی امروزی ، برخی از حروف دارای اشکال متمایز در انتهای و/یا ابتدای کلمات هستند. این مرزبندی علاوه بر فاصله گذاری استفاده می شود.
خط نستعلیق در رسم الخط اسلامی از آرایش عمودی برای جداسازی کلمات استفاده می کند. ابتدای هر کلمه بالاتر از انتهای کلمه قبل نوشته می شود، به طوری که یک خط از متن ظاهر دندان اره ای به خود می گیرد . نستعلیق از ایران گسترش یافته و امروزه برای فارسی ، اویغور ، پشتو و اردو استفاده می شود .
در املای انگشتی و در کد مورس ، کلمات با مکث از هم جدا می شوند.
برای استفاده با رایانه، این علامت ها دارای نقاط کد در یونیکد هستند :
در اسکریپت خطی B :
این خط فاصله دارد.