کلمه یک عنصر اساسی زبان است که حامل معنی است ، به تنهایی قابل استفاده است و وقفه ناپذیر است. [1] علیرغم این واقعیت که گویشوران زبان غالباً درک شهودی از چیستی یک کلمه دارند، بین زبان شناسان بر سر تعریف آن اتفاق نظر وجود ندارد و تلاش های متعدد برای یافتن معیارهای خاص این مفهوم بحث برانگیز است. [2] استانداردهای مختلفی بسته به پیشینه نظری و زمینه توصیفی پیشنهاد شده است. اینها در یک تعریف واحد همگرا نیستند. [3] : 13:618 برخی از تعاریف خاص از واژه "کلمه" برای انتقال معانی مختلف آن در سطوح مختلف توصیف، به عنوان مثال بر اساس مبانی واجی ، دستوری یا املایی استفاده می شود . دیگران پیشنهاد می کنند که این مفهوم صرفاً قراردادی است که در موقعیت های روزمره استفاده می شود. [4] : 6
مفهوم "کلمه" از یک تکواژ متمایز می شود ، که کوچکترین واحد زبانی است که معنی دارد، حتی اگر نتواند به تنهایی بایستد. [1] کلمات از حداقل یک تکواژ ساخته شده اند. مورفم ها همچنین می توانند برای ایجاد کلمات دیگر در فرآیند اشتقاق صرفی به یکدیگر ملحق شوند . [2] : 768 در انگلیسی و بسیاری از زبانهای دیگر، تکواژهایی که یک کلمه را تشکیل میدهند به طور کلی حداقل یک ریشه را شامل میشوند (مانند «سنگ»، «خدا»، «نوع»، «نوشته»، «میتوان»، «نه» ") و احتمالاً برخی از پسوندها ("-s"، "un-"، "-ly"، "-ness"). کلماتی که بیش از یک ریشه دارند ("[type][writ]er"، "[cow][boy]s"، "[tele][graph]ically") کلمات مرکب نامیده می شوند . به نوبه خود، کلمات ترکیب می شوند تا عناصر دیگری از زبان را تشکیل دهند، مانند عبارات ("یک سنگ قرمز"، "تحمل کردن")، بند ("من یک سنگ پرت کردم") و جملات ("من یک سنگ پرت کردم، اما از دست رفته").
در بسیاری از زبان ها، مفهوم آنچه که یک "کلمه" را تشکیل می دهد ممکن است به عنوان بخشی از یادگیری سیستم نوشتاری یاد شود. [5] این مورد برای زبان انگلیسی و برای اکثر زبانهایی است که با الفبای مشتق شده از الفبای لاتین یا یونانی باستان نوشته میشوند . در املای انگلیسی ، دنباله های حروف «سنگ»، «خدا»، «نوشتن»، «با»، «the» و «نه» به عنوان کلمات تک تکواژ در نظر گرفته می شوند، در حالی که «سنگ»، «بی خدایی»، ماشین تحریر»، و «نمیتوان» کلماتی هستند که از دو یا چند تکواژ تشکیل شدهاند («سنگ» + «s»، «un»+ «god»+ «li»+»ness، «type»+ «writ»+»er "، و "can"+"not").
از آغاز مطالعه زبانشناسی، تلاشهای متعددی برای تعریف یک کلمه با معیارهای مختلف انجام شده است. [5] با این حال، هنوز هیچ تعریف رضایتبخشی برای اعمال همه زبانها و در تمام سطوح تحلیل زبانی یافت نشده است. با این حال، می توان تعاریف ثابتی از "کلمه" در سطوح مختلف توصیف پیدا کرد. [4] : 6 اینها شامل تعاریف در سطح آوایی و واجی است ، که کوچکترین بخش از صدا است که می تواند به لحاظ نظری با لهجه کلمه و نشانگرهای مرزی جدا شود. در سطح املایی به عنوان بخشی که با فاصله های خالی در نوشتار یا چاپ نشان داده می شود . بر اساس صرف شناسی به عنوان عنصر اساسی پارادایم های دستوری مانند عطف ، متفاوت از شکل های کلمه؛ در معناشناسی به عنوان کوچکترین و نسبتاً مستقل حامل معنا در یک فرهنگ لغت. و از نظر نحوی به عنوان کوچکترین واحد تغییرپذیر و قابل تعویض یک جمله. [2] : 1285
در برخی از زبانها، این انواع مختلف واژهها بر هم منطبق هستند و میتوان به عنوان مثال، یک «کلمه واجشناختی» را اساساً با «کلمه دستوری» یکسان تحلیل کرد. با این حال، در زبان های دیگر ممکن است با عناصری با اندازه های مختلف مطابقت داشته باشند. [4] : 1 بسیاری از دشواری ها ناشی از سوگیری یورومحوری است ، زیرا زبان های خارج از اروپا ممکن است از شهود دانشمندان اروپایی پیروی نکنند. برخی از معیارهای توسعهیافته برای «واژه» تنها میتوانند برای زبانهایی با ساختار ترکیبی اروپایی قابل اجرا باشند . [4] : 1-3 به دلیل این وضعیت نامشخص، برخی از زبان شناسان پیشنهاد می کنند که از واژه "کلمه" به طور کلی اجتناب شود، در عوض بر اصطلاحات تعریف شده بهتر مانند تکواژها تمرکز کنند . [6]
فرهنگ لغت واژگان یک زبان را به شکلهای فهرستبندی شده جداگانه به نام لم طبقهبندی میکنند . اینها را می توان به عنوان نشانه ای از آنچه در نظر نویسندگان آن زبان «کلمه» تشکیل می دهد در نظر گرفت. این شکل نوشتاری یک کلمه یک واژگان را تشکیل می دهد . [2] : 670-671 مناسب ترین وسیله برای اندازه گیری طول کلمه، شمارش هجاها یا تکواژهای آن است. [7] هنگامی که یک کلمه دارای تعاریف متعدد یا چندین معنا باشد، ممکن است منجر به سردرگمی در یک بحث یا بحث شود. [8]
یک معنی متمایز از اصطلاح "کلمه" را می توان بر اساس مبانی واج شناختی تعریف کرد. واحدی است بزرگتر یا برابر با یک هجا که بر اساس ویژگی های قطعه ای یا عروضی یا از طریق تعامل آن با قواعد واج شناختی قابل تشخیص است. در والماتجاری ، یک زبان استرالیایی، ریشه ها یا پسوندها ممکن است فقط یک هجا داشته باشند، اما یک کلمه واجی باید حداقل دو هجا داشته باشد. ریشه فعل بی هجایی ممکن است پسوند صفر داشته باشد، به عنوان مثال luwa-ø 'hit!'، اما یک ریشه تک هجا باید پسوندی داشته باشد، به عنوان مثال ya-nta 'go!'، بنابراین با الگوی قطعه ای از کلمات Walmatjari مطابقت دارد. در گویش Pitjantjatjara زبان Wati ، زبان دیگری از استرالیا، یک هجای میانی کلمه می تواند به یک حرف بی صدا ختم شود، اما هجای آخر کلمه باید به یک مصوت ختم شود. [4] : 14
در بیشتر زبان ها، استرس ممکن است معیاری برای یک کلمه واجی باشد. در زبانهایی که تنش ثابتی دارند، میتوان مرزهای کلمه را از محل آن مشخص کرد. اگرچه پیشبینی مرزهای واژهها از استرس به تنهایی در زبانهایی با تنش واجی غیرممکن است، تنها یک هجا با تاکید اولیه در هر کلمه وجود خواهد داشت که امکان تعیین تعداد کل کلمات در یک گفته را فراهم میکند. [4] : 16
بسیاری از قواعد واج شناختی فقط در یک کلمه واجی یا به طور خاص در سراسر مرزهای کلمه عمل می کنند. در مجارستانی ، صامت های دندانی /d/، /t/، /l/ یا /n/ به نیمه مصوت زیر /j/ جذب می شوند و صدای کامی مربوطه را ایجاد می کنند، اما فقط در یک کلمه. برعکس، قوانین سندی خارجی در سراسر مرزهای کلمه عمل می کنند. نمونه اولیه این قانون از زبان سانسکریت آمده است . با این حال، جهش همخوان اولیه در زبانهای سلتیک معاصر یا پدیده پیوند r در برخی از گویشهای غیر روتیک انگلیسی نیز میتواند برای نشان دادن مرزهای کلمات استفاده شود. [4] : 17
اغلب اتفاق می افتد که یک کلمه واج شناختی با برداشت شهودی ما از یک کلمه مطابقت ندارد. کلمه مرکب فنلاندی pääkaupunki "پایتخت" از نظر واج شناختی دو کلمه ( pää "سر" و kaupunki "شهر") است زیرا با الگوهای فنلاندی هماهنگی مصوت در کلمات مطابقت ندارد . برعکس، یک کلمه واجشناختی ممکن است از بیش از یک عنصر نحوی تشکیل شده باشد، مانند عبارت انگلیسی I'll come ، جایی که من یک کلمه واجشناختی را تشکیل میدهد. [3] : 13:618
یک کلمه را می توان به عنوان یک آیتم در واژگان درونی یک گوینده در نظر گرفت. به این واژگان می گویند . با این حال، این ممکن است با معنی در گفتار روزمره "کلمه" متفاوت باشد، زیرا یک واژگان شامل تمام اشکال عطف است. اصطلاح قوری به قوری مفرد و همچنین قوری جمع اشاره دارد . همچنین این سؤال وجود دارد که تا چه حد باید واژههای مرکب یا مرکب در یک واژگان گنجانده شوند، بهویژه در زبانهای چسبناک. برای مثال، تردیدی وجود ندارد که در ترکی واژگان خانه باید شامل اسمی مفرد ev و جمع evler باشد . با این حال، مشخص نیست که آیا باید کلمه evlerinizden "از خانه های شما" را نیز در بر گیرد که از پسوند منظم تشکیل شده است. واژگانی مانند «سیاه و سفید» یا «خودت انجام بده» نیز وجود دارد که اگرچه از چند واژه تشکیل شده است، اما همچنان یک ترکیب واحد با معنایی مجموعه را تشکیل می دهند. [3] : 13:618
واژههای دستوری شامل تعدادی عناصر دستوری هستند که با هم (نه در مکانهای مجزا در یک بند) به ترتیب ثابت و دارای معنای مشخصی هستند. با این حال، برای همه این معیارها استثنا وجود دارد. [4] : 19
تک کلمات دستوری ساختار درونی ثابتی دارند. وقتی ساختار تغییر می کند، معنای کلمه نیز تغییر می کند. در دییربال که میتواند از پسوندهای مشتق بسیاری با اسمهای خود استفاده کند، پسوند دوگانه -جاران و پسوند -گابون به معنای «دیگری» وجود دارد. با اسم yibi می توان آنها را به yibi-jarran-gabun («دو زن دیگر») یا yibi-gabun-jarran («دو زن دیگر») مرتب کرد، اما تغییر ترتیب پسوند نیز معنای آنها را تغییر می دهد. گویندگان یک زبان نیز معمولاً معنای خاصی را با یک کلمه و نه یک تکواژ مرتبط می دانند. به عنوان مثال، هنگامی که از آنها خواسته می شود در مورد نادرستی صحبت کنند ، به ندرت بر معنای تکواژهایی مانند -th یا -ness تمرکز می کنند . [4] : 19-20
لئونارد بلومفیلد مفهوم «حداقل فرمهای آزاد» را در سال 1928 معرفی کرد. کلمات به عنوان کوچکترین واحد گفتاری معنادار در نظر گرفته میشوند که میتوانند به تنهایی بایستند. [9] : 11 این واج ها (واحدهای صدا) را با واژگان (واحدهای معنا) مرتبط می کند. با این حال، برخی از کلمات نوشته شده اشکال آزاد حداقلی نیستند زیرا به خودی خود معنی ندارند (مثلاً و از ). [10] : 77 برخی از معناشناسان نظریهای از بهاصطلاح ابتداییهای معنایی یا اعداد اول معنایی ارائه کردهاند ، واژگانی تعریفناپذیر که مفاهیم بنیادی را نشان میدهند که به طور شهودی معنادار هستند. بر اساس این نظریه، اعداد اول معنایی به عنوان مبنایی برای توصیف معنای، بدون دایرهای، سایر کلمات و دلالتهای مفهومی مرتبط با آنها عمل میکنند. [11] [12]
در مکتب نحو نظری مینیمالیستی ، کلمات (که در ادبیات اقلام واژگانی نیز نامیده میشوند) به عنوان «بستهای» از ویژگیهای زبانی تعبیر میشوند که در ساختاری با شکل و معنا متحد میشوند. [13] : 36-37 به عنوان مثال، کلمه "کوالا" دارای ویژگی های معنایی (به اشیاء دنیای واقعی، کوالاها اشاره می کند )، ویژگی های دسته بندی (اسم است)، ویژگی های عددی (جمع است و باید با افعال مطابقت داشته باشد. ضمایر و مصادیق در حوزه آن)، ویژگی های واج شناختی (به گونه ای خاص تلفظ می شود) و غیره.
در زبانهای دارای سنت ادبی , این پرسش که چه کلمه ای واحد محسوب می شود , متاثر از املا است . جداکنندههای کلمات ، معمولاً فاصلهها و علامتهای نقطهگذاری در املای مدرن زبانها با استفاده از حروف الفبا رایج هستند ، اما اینها پیشرفت نسبتاً مدرنی در تاریخ نوشتن هستند . در رمزگذاری کاراکتر ، تقسیم بندی کلمات به این بستگی دارد که کدام کاراکترها به عنوان تقسیم کننده کلمات تعریف شوند. در املای انگلیسی ، عبارات ترکیبی ممکن است حاوی فاصله باشد. به عنوان مثال، بستنی ، پناهگاه حمله هوایی و برخاستن، هر کدام معمولاً شامل بیش از یک کلمه در نظر گرفته میشوند (زیرا هر یک از اجزاء فرمهای آزاد هستند، به استثنای ممکن است get ) و بنابراین هیچکس نیست ، اما به همین ترتیب مرکب کسی و هیچ کس تک کلمه در نظر گرفته می شود.
گاهی اوقات، زبان هایی که از نظر گرامری نزدیک هستند، ترتیب کلمات یکسانی را به روش های مختلف در نظر می گیرند. به عنوان مثال، افعال انعکاسی در مصدر فرانسوی از ذره مربوطه خود جدا هستند، مثلاً se laver ("خود شستن")، در حالی که در پرتغالی با خط فاصله، به عنوان مثال lavar-se ، و در اسپانیایی آنها به هم متصل می شوند، مانند lavarse . [a]
همه زبان ها کلمات را مشخصاً محدود نمی کنند. چینی ماندارین یک زبان بسیار تحلیلی با پسوندهای عطفی اندک است، که باعث میشود محدودیتهای املایی کلمات ضروری نباشد. با این حال، بسیاری از ترکیبات چند تکواژی در ماندارین، و همچنین انواع تکواژهای محدود وجود دارد که تعیین واضح کلمه را دشوار می کند. [14] : 56 ژاپنی از نشانه های املایی برای تعیین حدود کلمات استفاده می کند، مانند جابجایی بین کانجی (نویسه های وام گرفته شده از نوشتار چینی) و دو هجای کانا . این یک قانون نسبتاً نرم است، زیرا کلمات محتوا را نیز میتوان در هیراگانا برای تأثیرگذاری نوشت ، اگرچه اگر به طور گسترده انجام شود، معمولاً فضاهایی برای حفظ خوانایی اضافه میشود. املای ویتنامی ، اگرچه از الفبای لاتین استفاده می کند ، به جای کلمات، تکواژهای تکواژی را محدود می کند.
وظیفه تعریف اینکه چه چیزی یک کلمه را تشکیل می دهد، شامل تعیین جایی است که یک کلمه به پایان می رسد و کلمه دیگر شروع می شود. چندین روش برای شناسایی مرزهای کلمات موجود در گفتار وجود دارد: [5]
مورفولوژی مطالعه تشکیل و ساختار کلمه است . کلمات ممکن است تحت فرآیندهای صرفی متفاوتی قرار گیرند که به طور سنتی به دو گروه گسترده طبقه بندی می شوند: اشتقاق و عطف . اشتقاق فرآیندی است که در آن یک کلمه جدید با تعدیل معنای آن و اغلب با تغییر کلاس کلمه از کلمات موجود ایجاد می شود. به عنوان مثال، در زبان انگلیسی، فعل تبدیل ممکن است به اسم تبدیل از طریق تغییر استرس و به صفت تبدیل شدنی از طریق الصاق تغییر یابد. عطف اطلاعات دستوری را به یک کلمه اضافه می کند، مانند نشان دادن حالت، زمان یا جنسیت. [14] : 73
در زبانهای ترکیبی ، ریشه یک کلمه (مثلاً عشق ) ممکن است به شکلهای مختلف (مثلاً عشق ، دوست داشتن و دوست داشتن ) عطف شود. با این حال، برای برخی اهداف، اینها معمولاً کلمات متفاوتی در نظر گرفته نمیشوند، بلکه اشکال متفاوتی از یک کلمه هستند. در این زبان ها، کلمات ممکن است از تعدادی تکواژ ساخته شده باشند .
به ویژه در زبان های هند و اروپایی ، تکواژهای متمایز عبارتند از:
بنابراین، پروتو-هندواروپایی *wr̥dhom به عنوان متشکل از
فیلسوفان حداقل از قرن پنجم قبل از میلاد، با پایه گذاری فلسفه زبان ، کلمات را به عنوان موضوعاتی جذاب یافته اند . افلاطون کلمات را از نظر منشأ آنها و صداهای سازنده آنها تجزیه و تحلیل کرد و به این نتیجه رسید که بین صدا و معنا ارتباطی وجود دارد، اگرچه کلمات در طول زمان تغییرات زیادی می کنند. جان لاک نوشت که استفاده از کلمات "این است که نشانه های معقولی از ایده ها باشد"، اگرچه آنها "به دلیل هیچ ارتباط طبیعی که بین صداهای مشخص خاص و ایده های خاص وجود دارد انتخاب نشده اند، زیرا در این صورت فقط یک زبان در میان همه انسان ها وجود خواهد داشت. اما با یک تحمیل داوطلبانه، که به موجب آن چنین کلمه ای خودسرانه نشانه چنین ایده ای قرار می گیرد». [16] اندیشه ویتگنشتاین از یک کلمه به عنوان بازنمایی معنا به "معنای یک کلمه استفاده از آن در زبان است." [17]
هر کلمه بر اساس ویژگی های دستوری مشترک به یک دسته تعلق دارد . به طور معمول، واژگان یک زبان ممکن است به چندین گروه از این قبیل کلمات طبقه بندی شود. تعداد کل دسته ها و همچنین انواع آنها جهانی نیست و در بین زبان ها متفاوت است. به عنوان مثال، انگلیسی دارای گروهی از کلمات به نام مقاله است ، مانند ( مقطع مشخص) یا a (مقطع نامعین)، که مشخص بودن یا شناسایی بودن را نشان می دهد. این کلاس در ژاپنی وجود ندارد، که برای نشان دادن این تفاوت به زمینه بستگی دارد. از سوی دیگر، زبان ژاپنی دارای دستهای از کلمات به نام ذرات است که برای علامتگذاری عبارات اسمی با توجه به عملکرد دستوری یا رابطه موضوعی آنها استفاده میشود، که انگلیسی آنها را با ترتیب کلمات یا عروض علامتگذاری میکند. [18] : 21-24
مشخص نیست که آیا مقولهای غیر از استقاد، بخشهای جهانی زبان انسان هستند یا خیر. تقسیم دو بخشی اساسی که در زبان های طبیعی همه جا وجود دارد ، تقسیم اسم ها در مقابل افعال است . با این حال، در برخی از زبانهای واکاشان و سالیش ، همه کلمات محتوا ممکن است به صورت کلامی درک شوند. در Lushootseed ، یک زبان سالیش، همه کلمات با معانی «اسم مانند» را می توان به صورت قید استفاده کرد، جایی که آنها مانند فعل عمل می کنند. برای مثال، کلمه sbiaw را میتوان بهعنوان «(یک) کایوت است» بهجای «کایوت» درک کرد. [19] [3] : 13:631 از سوی دیگر، در زبانهای اسکیمو-آلوت، همه کلمات محتوا را میتوان بهعنوان اسمی تحلیل کرد، و اسامی فاعل نزدیکترین نقش را به افعال دارند. در نهایت، در برخی از زبانهای آسترونزی مشخص نیست که آیا این تمایز قابل اعمال است یا خیر و همه کلمات را میتوان به بهترین شکل به عنوان حروف الفبا توصیف کرد که میتوانند نقش دستههای دیگر را ایفا کنند. [3] : 13:631
طبقه بندی فعلی کلمات به طبقات بر اساس کار دیونیسیوس تراکس است که در قرن اول پیش از میلاد هشت دسته از کلمات یونان باستان را متمایز کرد: اسم ، فعل ، جزء ، ماده ، ضمیر ، حرف اضافه ، قید و ربط . نویسندگان لاتین بعدی، Apollonius Dyscolus و Priscian، چارچوب او را به زبان خود اعمال کردند. از آنجایی که لاتین مقاله ای ندارد، این کلاس را با الفاظ جایگزین کردند . صفت ها («شاد»)، کمیت کننده ها («چند») و اعداد («یازده») به دلیل شباهت صرفی آنها به اسم ها در لاتین و یونان باستان، در آن طبقه بندی ها از هم جدا نبودند. آنها تنها زمانی به عنوان مقوله های متمایز شناخته شدند که محققان شروع به مطالعه زبان های اروپایی بعدی کردند. [3] : 13:629
در سنت دستور زبان هندی، پانینی طبقهبندی بنیادی مشابهی را بر اساس مجموعهای از پسوندها به کلاس اسمی (nāma, suP) و لفظی (ākhyata, tiN) معرفی کرد . برخی از کلمات می توانند بحث برانگیز باشند، مانند زبان عامیانه در زمینه های رسمی. نامهای نادرست، به دلیل آنکه معنایی ندارند که دلالت میکنند. یا کلمات چند معنایی ، به دلیل سردرگمی بالقوه بین حواس مختلف آنها. [20]
در سنت دستور زبان یونان و روم باستان، کلمه واحد اصلی تجزیه و تحلیل بود. اشکال دستوری مختلف یک واژگان معین مورد مطالعه قرار گرفت. با این حال، هیچ تلاشی برای تجزیه آنها به تکواژ وجود دارد. [21] : 70 این ممکن است نتیجه ماهیت ترکیبی این زبان ها باشد، جایی که ساختار درونی کلمات ممکن است سخت تر از زبان های تحلیلی رمزگشایی شود. همچنین هیچ مفهومی از انواع مختلف کلمات، مانند دستوری یا واجی وجود نداشت - این کلمه یک ساختار واحد در نظر گرفته شد. [4] : 269 کلمه ( dictiō ) به عنوان واحد حداقل یک گفته ( ōrātiō ) ، بیان یک فکر کامل تعریف شد. [21] : 70
{{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: location missing publisher (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: location missing publisher (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link)