Pengertian dan Fungsi Unicode pada Dunia Komputer

Tampilan Unicode

Unicode adalah standar pengkodean karakter universal. Ini mendefinisikan cara karakter individu direpresentasikan dalam file teks, halaman web, dan jenis dokumen lainnya.

Tidak seperti ASCII, yang dirancang untuk hanya mewakili karakter bahasa Inggris dasar, Unicode dirancang untuk mendukung karakter dari semua bahasa di seluruh dunia. Set karakter ASCII standar hanya mendukung 128 karakter, sedangkan Unicode dapat mendukung sekitar 1.000.000 karakter. Sementara ASCII hanya menggunakan satu byte untuk mewakili setiap karakter, Unicode mendukung hingga 4 byte untuk setiap karakter.

Ada beberapa jenis penyandian Unicode, meskipun UTF-8 dan UTF-16 adalah yang paling umum. UTF-8 telah menjadi pengkodean karakter standar yang digunakan di Web dan juga merupakan pengkodean default yang digunakan oleh banyak program perangkat lunak . Sementara UTF-8 mendukung hingga empat byte per karakter, tidak efisien menggunakan empat byte untuk mewakili karakter yang sering digunakan. Oleh karena itu, UTF-8 hanya menggunakan satu byte untuk mewakili karakter bahasa Inggris yang umum. Karakter Eropa (Latin), Ibrani, dan Arab diwakili dengan dua byte, sedangkan tiga byte digunakan untuk karakter Cina, Jepang, Korea, dan Asia lainnya. Karakter Unicode tambahan dapat direpresentasikan dengan empat byte.

Lebih baru Lebih lama