Pembicaraan Wikikamus:Kebijakan inklusi
Komentar
sunting- Mungkin daftar bahasa daerah bisa diambil dari daftar yang resmi, seperti peta bahasa kemdikbud?
- Attestation (pencatatan? kurang yakin bahasa Indonesianya apa) - salah satu hal yang penting juga, karena jika lemanya hanya dipakai 2-3 orang, atau hanya merupakan hapax legomenon dalam karya yang tidak layak/notable, mungkin tidak layak masuk kamus juga
Sekian feedback saya. --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 05.08 (UTC)
- @Fehufanga: Untuk bahasa daerah saya usulkan mengikuti Daftar Ethnologue saja, karena selain sudah memuat kode ISO, banyak juga bahasa tidak tercatat di daftar Kemdikbud (seperti Kaidipang). Saya setuju mengenai atestasi (bentuk tercatat?), mungkin bisa menggunakan korpus seperti Korpus Leipzig atau Korpus SEALANG, menghindari kasus seperti "kulacino" dalam KBBI. Mbee-wiki (bicara) 22 Juni 2022 13.30 (UTC)
- Oh iya juga, ada Ethnologue. Kedua korpus tersebut nampaknya bagus untuk atestasi. --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 23.04 (UTC)
- Untuk kata-kata yang berasal dari karya fiksi (misalnya mithril dari seri LoTR), apakah "memerlukan paling tidak atestasi di luar karya fiksi" merupakan kriteria atestasi yang dapat digunakan? Tinggal menentukan berapa nilai . --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 23.09 (UTC)
- Saya mengusulkan 5-10 kemunculan diluar karya fiksi yang bersangkutan. Namun apakah kemunculan di internet (termasuk sosial media) dihitung? Apakah ada cara tertentu untuk mencari dari korpus Internet? Saya mengambil contoh kata-kata yang lazim digunakan seperti "pintu ke mana saja" dari Doraemon dan "jubah gaib" dari Harry Potter, keduanya lazim digunakan di sosmed namun tidak atau sulit ditemukan di korpus ataupun di google trends. Mbee-wiki (bicara) 23 Juni 2022 11.01 (UTC)
- Kalau menurut saya, bobot penggunaan lema di sosmed seharusnya tidak sebesar bobot penggunaan lema dalam karya tulis yang lebih dikenal. --*Fehufangą (✉ Pembicaraan) 24 Juni 2022 09.57 (UTC)
- Saya mengusulkan 5-10 kemunculan diluar karya fiksi yang bersangkutan. Namun apakah kemunculan di internet (termasuk sosial media) dihitung? Apakah ada cara tertentu untuk mencari dari korpus Internet? Saya mengambil contoh kata-kata yang lazim digunakan seperti "pintu ke mana saja" dari Doraemon dan "jubah gaib" dari Harry Potter, keduanya lazim digunakan di sosmed namun tidak atau sulit ditemukan di korpus ataupun di google trends. Mbee-wiki (bicara) 23 Juni 2022 11.01 (UTC)
- @Fehufanga: Saya sudah mencoba membuat bagian untuk ketercatatan (attestation), sila dilihat dan dikembangkan lebih jauh. Mbee-wiki (bicara) 29 Juli 2022 12.48 (UTC)
- Ada masalah dengan ketercatatan dalam bahasa Indonesia yang tidak ada (atau hampir ada) dalam bahasa Inggris. Itu teks berkualitas buruk yang dibuat dengan terjemahan mesin dari bahasa Inggris. Apakah kata seperti "dimana" ("kota dimana saya pernah bersekolah") atau "diluar" atau "di gunakan" atau "sosial media" (melawan aturan "baik dalam kata majemuk maupun dalam kalimat, segala sesuatu yang menerangkan terletak di belakang yang diterangkan") bagus? Taylor 49 (bicara) 29 Juli 2022 20.33 (UTC)
- Menurut saya, dimana, diluar, di gunakan, dan kesalahan ejaan lainnya dapat memiliki halamannya sendiri. Namun, halaman itu hanya berfungsi sebagai pengalihan ke kata dengan ejaan yang benar (contoh: en:pronounciation mengalihkan pembaca ke en:pronunciation). Kalau sosial media, karena sudah banyak digunakan, seharusnya tidak ada masalah dimasukkan ke dalam kamus. Saya tidak ingat ada kata-kata lain yang melawan urutan kata utama/head-directionality dalam bahasa Indonesia, namun Inggris juga memiliki kata-kata dengan kata utama yang dibalik. en:court martial, en:attorney general, adalah beberapa contoh yang saya ingat. --*Fehufangą (✉ Pembicaraan) 29 Juli 2022 23.12 (UTC)
- Kembang kol, Amerika Serikat, dan perdana menteri adalah kata-kata yang lazim dan baku, namun letak inti-pewatasnya terbalik. Ini biasa terjadi pada kata-kata serapan terjemah (calque) dari bahasa asing ke bahasa Indonesia. Bentuk "kali pertama", "kali kedua", dst. juga lazim ditemukan meskipun tidak selazim "pertama kali", "kedua kali", dst. Setuju dengan Fehufanga, tidak masalah sepertinya selama penggunaannya lazim dan berterima, serta bukan hapax legomenon. Mbee-wiki (bicara) 30 Juli 2022 04.05 (UTC)
- Menurut saya, dimana, diluar, di gunakan, dan kesalahan ejaan lainnya dapat memiliki halamannya sendiri. Namun, halaman itu hanya berfungsi sebagai pengalihan ke kata dengan ejaan yang benar (contoh: en:pronounciation mengalihkan pembaca ke en:pronunciation). Kalau sosial media, karena sudah banyak digunakan, seharusnya tidak ada masalah dimasukkan ke dalam kamus. Saya tidak ingat ada kata-kata lain yang melawan urutan kata utama/head-directionality dalam bahasa Indonesia, namun Inggris juga memiliki kata-kata dengan kata utama yang dibalik. en:court martial, en:attorney general, adalah beberapa contoh yang saya ingat. --*Fehufangą (✉ Pembicaraan) 29 Juli 2022 23.12 (UTC)
- Ada masalah dengan ketercatatan dalam bahasa Indonesia yang tidak ada (atau hampir ada) dalam bahasa Inggris. Itu teks berkualitas buruk yang dibuat dengan terjemahan mesin dari bahasa Inggris. Apakah kata seperti "dimana" ("kota dimana saya pernah bersekolah") atau "diluar" atau "di gunakan" atau "sosial media" (melawan aturan "baik dalam kata majemuk maupun dalam kalimat, segala sesuatu yang menerangkan terletak di belakang yang diterangkan") bagus? Taylor 49 (bicara) 29 Juli 2022 20.33 (UTC)
Bahasa Buatan
suntingSaya mengusulkan cukup Esperanto (eo) saja yang termasuk dalam cakupan dari WT-ID. Bahasa ini sudah memiliki sumber dan komunitas yang cukup berkembang di Indonesia, sementara bahasa-bahasa buatan yang lain masih belum sampai level demikian. Untuk Toki Pona mungkin bisa dibuat menjadi lampiran saja, seperti di WT-EN. Mbee-wiki (bicara) 22 Juni 2022 13.44 (UTC)
- Saya tidak ada masalah dengan itu. --*Fehufangą (✉ Pembicaraan) 22 Juni 2022 23.06 (UTC)
- Cukup bagus untuk saya. Taylor 49 (bicara) 24 Juni 2022 14.36 (UTC)
- @Fehufanga @Taylor 49: Apakah perlu dibuat voting di Warung Kopi? Mbee-wiki (bicara) 26 Juni 2022 02.34 (UTC)
- Cukup bagus untuk saya. Taylor 49 (bicara) 24 Juni 2022 14.36 (UTC)
- Saya mengubah teks ke "Bahasa buatan lain (seperti Toki Pona) dapat diperbolehkan dalam ruang nama utama atau Lampiran hanya sesudah diskusi tertentu.". Taylor 49 (bicara) 26 Juni 2022 09.16 (UTC)
- skolo dalam bahasa Ido. Hapus? Taylor 49 (bicara) 7 Juli 2022 19.55 (UTC)
- Diganti saja semua dengan b. Esperanto. Jika merujuk dari Esperanto-Indonezia Vortaro, "skolo" bermakna "sekolah (dalam seni atau filsafat)". Mbee-wiki (bicara) 8 Juli 2022 12.36 (UTC)
- Tidak ada semua. Halaman "skolo" sudah menjadi halaman lema Esperanto. Bagian tentang bahasa Ido dihapus dari dua halaman lain yang memiliki bahasa lagi yang diperbolehkan. Dua halaman lema dan dua halaman lain untuk bahasa Ido diusulkan untuk penghapusan. Taylor 49 (bicara) 9 Juli 2022 19.52 (UTC)
Entri
suntingSaya rasa perlu ada pengkategorian yang jelas di dalam wikikamus. Merujuk ke diskusi sebelumnya, kondisi kategorisasi wikikamus, serta membandingkan dengan WT-EN, saya mengusulkan rancangan berikut:
- Kategori tertinggi dari tiap bahasa adalah "Kategori:Bahasa X". Kategori ini termasuk juga untuk indeks, templat, modul, juga untuk bentuk morfem.
- Kategori berikutnya adalah "Kategori:xx:Lema" untuk lema dan "Kategori:xx:Sublema" untuk segala bentuk turunan dari lema (mis. "jalan" adalah lema, maka "berjalan" adalah sublema). Kedua kategori ini bisa dihubungkan secara interwiki. Di sisi lain "Kategori:Kata bahasa X" dihapuskan atau dipindahkan
- Kategori berikutnya terbagi menurut lema atau sublema. Untuk lema adalah "Kategori:xx:kelas kata" atau "Kategori:xx:Frasa", sementara untuk sublema adalah "Kategori:xx:Sublema kelas kata".
Contohnya: "Kategori:Bahasa Tionghoa" > "Kategori:zh:Lema" > "Kategori:zh:Nomina" / "Kategori:zh:Frasa"
- "Kategori:zh:Sublema" > "Kategori:zh:Sublema nominal".
Mbee-wiki (bicara) 8 Juli 2022 14.00 (UTC)
- Setuju. Apalagi dengan "Kategori tertinggi dari tiap bahasa adalah "Kategori:Bahasa X". Kategori ini termasuk juga untuk indeks, templat, modul, juga untuk bentuk morfem", dan jangan berisi lema. Struktur lema (juga frasa dan "bentuk kurang-lema" seperti "dogs" dari "dog") harus ditentukan. Taylor 49 (bicara) 9 Juli 2022 19.52 (UTC)
- Ya, lema dan sublema tidak perlu masuk halaman kategori tertinggi, cukup halaman kategorinya saja. Penentuan apa yang dianggap sebagai lema dan sublema sepertinya perlu ditentukan dalam tiap-tiap bahasa. Mungkin nanti dibutuhkan juga semacam panduan entri tiap-tiap bahasa seperti di WT-EN (macam halaman-halaman "Wiktionary:About X"). Mbee-wiki (bicara) 28 Juli 2022 14.38 (UTC)