Shortcut: WD:Gloss

Wikidata:Lexicographical data/Glossary/id: Difference between revisions

From Wikidata
Jump to navigation Jump to search
Content deleted Content added
Fexpr (talk | contribs)
Created page with "'''Bahasa Glosa''' direpresentasikan sebagai sebuah kode bahasa."
Fexpr (talk | contribs)
Created page with "'''Fitur gramatikal''': Spesifikasi dari sebuah kondisi atau peran sintaksis di mana sebuah bentuk digunakan. Fitur gramatikal direpresentasikan sebagai kumpulan butir yang tidak terurut (bisa jadi kosong)."
Line 6: Line 6:
* {{anchor|Gloss}}'''Glosa''': Definisi bahasa alami dari sebuah [[#Sense|makna]] (lihat {{Q|Q1132324}}). Glosa adalah sekumpulan pasangan tak terurut yang tidak kosong, yang masing-masing berisi dari pasangan string dan [[#Gloss language|bahasa glosa]]. Baik seluruh pasangan dan bagian stringnya dapat disebut '''glosa''''. Glosa menampilkan definisi dari sebuah Leksem dalam berbagai bahasa. Sebagai contoh, sebuah kata dalam bahasa Prancis mungkin memiliki glosa dalam bahasa Prancis, selain glosa dalam bahasa Jerman.
* {{anchor|Gloss}}'''Glosa''': Definisi bahasa alami dari sebuah [[#Sense|makna]] (lihat {{Q|Q1132324}}). Glosa adalah sekumpulan pasangan tak terurut yang tidak kosong, yang masing-masing berisi dari pasangan string dan [[#Gloss language|bahasa glosa]]. Baik seluruh pasangan dan bagian stringnya dapat disebut '''glosa''''. Glosa menampilkan definisi dari sebuah Leksem dalam berbagai bahasa. Sebagai contoh, sebuah kata dalam bahasa Prancis mungkin memiliki glosa dalam bahasa Prancis, selain glosa dalam bahasa Jerman.
* {{anchor|Gloss language}}'''Bahasa Glosa''' direpresentasikan sebagai sebuah [[#Language code|kode bahasa]].
* {{anchor|Gloss language}}'''Bahasa Glosa''' direpresentasikan sebagai sebuah [[#Language code|kode bahasa]].
* {{anchor|Grammatical feature}}<span lang="en" dir="ltr" class="mw-content-ltr">'''Grammatical feature''': A specification of the conditions or the syntactic roles in which the [[#Form|form]] is used. Grammatical features are represented as an unordered (possibly empty) set of [[Special:MyLanguage/Wikidata:Glossary#Item|items]].</span>
* {{anchor|Grammatical feature}}'''Fitur gramatikal''': Spesifikasi dari sebuah kondisi atau peran sintaksis di mana sebuah [[#Form|bentuk]] digunakan. Fitur gramatikal direpresentasikan sebagai kumpulan [[Special:MyLanguage/Wikidata:Glossary#Item|butir]] yang tidak terurut (bisa jadi kosong).
* {{anchor|Language}}<span class="mw-translate-fuzzy">'''Bahasa''' adalah istilah yang diterapkan secara berbeda di bagian data leksikografis yang berbeda; lihat [[#Gloss language|bahasa glos]] and [[#Lexeme language|bahasa leksem]].</span>
* {{anchor|Language}}<span class="mw-translate-fuzzy">'''Bahasa''' adalah istilah yang diterapkan secara berbeda di bagian data leksikografis yang berbeda; lihat [[#Gloss language|bahasa glos]] and [[#Lexeme language|bahasa leksem]].</span>
* {{anchor|Language code}}<span lang="en" dir="ltr" class="mw-content-ltr">'''Language code''': A code that assigns letters or numbers as identifiers or classifiers for languages (see {{Q|Q2092812}}). The valid language codes in lexicographical data are mostly a subset of valid (BCP 47) {{Q|Q1059900}} and a superset of [[Special:MyLanguage/Help:Languages|label languages]]. It may have an optional private-use subtag in format -x-Q######.</span>
* {{anchor|Language code}}<span lang="en" dir="ltr" class="mw-content-ltr">'''Language code''': A code that assigns letters or numbers as identifiers or classifiers for languages (see {{Q|Q2092812}}). The valid language codes in lexicographical data are mostly a subset of valid (BCP 47) {{Q|Q1059900}} and a superset of [[Special:MyLanguage/Help:Languages|label languages]]. It may have an optional private-use subtag in format -x-Q######.</span>

Revision as of 06:58, 14 June 2024

  • Bentuk (atau Bentukan) di sini didefinisikan sebagai realisasi gramatikal dari sebuah Leksem. Bentuk ini dapat berupa infleksi dan deklensi. Sebagai contoh, dalam bahasa Inggris, kata kerja "run" menjadi "running" sebagai bentuk present participle dan "runs" sebagai bentuk orang ketiga tunggal. Peran setiap bentuk dilambangkan dengan fitur gramatikal. Sebuah bentuk adalah sebuah subentitas. Subentitas ini meliputi sebuah ID, sebuah representasi, sebuah daftar fitur gramatikal yang tidak berurutan (dan bisa jadi kosong), serta daftar pernyataan bentuk. Bentuk memiliki ID yang dimulai dengan ID dari Leksem tersebut, diikuti dengan tanda hubung ("-") dan huruf "F", lalu diikuti dengan bilangan asli dalam notasi desimal, seperti L123-F7. Hal ini untuk mencegah adanya bentuk-bentuk yang berbeda pada Leksem yang berbeda.
  • Pernyataan bentuk: Sebuah pernyataan yang mendeskripsikan bentuk atau hubungannya dengan bentuk lain atau butir (mis. IPA, audio pengucapan).
  • Glosa: Definisi bahasa alami dari sebuah makna (lihat gloss (Q1132324)). Glosa adalah sekumpulan pasangan tak terurut yang tidak kosong, yang masing-masing berisi dari pasangan string dan bahasa glosa. Baik seluruh pasangan dan bagian stringnya dapat disebut glosa'. Glosa menampilkan definisi dari sebuah Leksem dalam berbagai bahasa. Sebagai contoh, sebuah kata dalam bahasa Prancis mungkin memiliki glosa dalam bahasa Prancis, selain glosa dalam bahasa Jerman.
  • Bahasa Glosa direpresentasikan sebagai sebuah kode bahasa.
  • Fitur gramatikal: Spesifikasi dari sebuah kondisi atau peran sintaksis di mana sebuah bentuk digunakan. Fitur gramatikal direpresentasikan sebagai kumpulan butir yang tidak terurut (bisa jadi kosong).
  • Bahasa adalah istilah yang diterapkan secara berbeda di bagian data leksikografis yang berbeda; lihat bahasa glos and bahasa leksem.
  • Language code: A code that assigns letters or numbers as identifiers or classifiers for languages (see language identifier (Q2092812)). The valid language codes in lexicographical data are mostly a subset of valid (BCP 47) IETF language tag (Q1059900) and a superset of label languages. It may have an optional private-use subtag in format -x-Q######.
  • Lemma: The canonical, dictionary, or citation form of a word (see lemma (Q18514)). For example, "run", "runs", "ran", and "running" are forms of the same lexeme, with "run" as the lemma. Lemmas are not simple strings, but a non-empty unordered set of pairs that include a string and a spelling variant. Each of the pairs or the string parts thereof may also be called a lemma. Therefore, a lemma can include words in multiple orthographies. For example, the lemma for the English noun "color" would include "colour" for British English as well as "color" for American English.
  • Lexeme: A lexical element of a language, such as a word, a phrase, or a affix (see lexeme (Q111352)). It consists of a set of forms taken by a single word in one language, and words in any variant orthographies thereof. For example, the English nouns "color" and "colour" and their plural forms "colors" and "colours" are considered as one lexeme, while English noun "color" and verb "color" are two lexemes. Every lexeme is an entity and is stored in a page in the Lexeme: namespace. A lexeme includes a prefixed id (like L123), a lemma, a lexeme language, a lexical category, a list of lexeme statements, a list of forms, and a list of senses.
  • Bahasa leksem ditandai dengan sebuah butir.
  • Lexeme statement: A statement not specific to a Form or Sense (e.g. derived from grammatical gender or syntactic function)
  • Kategori leksikal (atau kelas kata) adalah sebuah cara klasifikasi leksem yang digunakan oleh Wikidata untuk mengkategorikan leksem dengan properti tata bahasa yang sama (lihat part of speech (Q82042)). Untuk macam-macam kelas kata yang digunakan di sebuah leksem, misalnya, noun (Q1084) dan verb (Q24905), lihat di Wikidata:Lexicographical data/Documentation/Languages/id#Lexical categories.
  • Representation: The text of a form. Like lemmas, representations are not simple strings, but a non-empty unordered set of string/spelling variant pairs. Each of the pairs or the string part thereof may also be called a representation.
  • Sense: A meaning of a lexeme which it may represent in a text. Any number of senses may be defined, although every lexeme should have at least one. A sense is a subentity. It includes an ID, a gloss and a list of sense statements. Senses have IDs starting with the ID of the lexeme they belong to, followed by a hyphen ("-") and an "S", followed by a natural number in decimal notation: e.g. L123-S4.
  • Sense statement: A statement describing the sense and its relations to senses and items (e.g. translation, synonym, antonym, connotation).
  • Spelling variant: The specific orthography of a lemma or representation, for example British English (en-gb) and American English (en-us) are different spelling variants. A spelling variant is represented as a language code.
  • Subentity: A form or a sense. They are a special kind of entity and may be used in statements, but they do not have their own pages. Instead, all the information of a subentity is stored in the page of the lexeme that a subentity belongs to. Each subentity functionally depends on a single lexeme.