Topic / sectie - Karaktersets

9 belangrijke vragen over Topic / sectie - Karaktersets

Waaraan zijn de getallen 0-31 en 127 van ASCII toegewezen?

Bewerkingskarakters.

Waaraan zijn de overige getallen van ASCII toegewezen?

Printbare karakters (alfabet).

De ASCII-standaard heeft varianten voor verschillende landen, omdat verschillende talen bijvoorbeeld andere accenten en symbolen kunnen hebben. Dat zorgt ervoor dat een tekst in bijvoorbeeld de standaard voor Amerikaans Engels niet altijd helemaal correct overkomt in Brits Engels. Wat is een manier om dit te ondervangen?

Door de 7-bits ASCII, die de range 0-127 aankan, te vervangen door een 8-bits variant, die van 0-255 kan. Daarbij wordt de range 0-127 toegewezen aan de ASCII zoals in het overzicht is aangegeven en de range 128-255 wordt dan gebruikt voor alle denkbare leestekens, accenten en symbolen, zodat één variant volstaat voor alle landen die het desbetreffende alfabet gebruiken. Om alle verschillende talen te kunnen bedienen, blijken 256 codepunten overigens nog steeds niet voldoende.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Ondanks de standaardisatie van ASCII worden karakters nog steeds verschillend toegewezen door verschillende platformen, waardoor compatibiliteit tussen bijvoorbeeld Windows en Mac moeilijk blijft. Wat is de enige echte oplossing hiervoor?

De enige echte oplossing hiervoor is om meer dan acht bit te gebruiken voor elke waarde. Een 16-bits karakterset kan 256 varianten van een 8-bit karakterset tegelijkertijd aan. Een 24-bits karakterset kan 256 varianten van een 16-bits karakterset tegelijkertijd aan. Zo ontstaan enorme, meerdimensionale karaktersets met subsets (ISO 10646 en Unicode).

Uit hoeveel codepunten bestaat een 16-bits karakterset?

65.536 codepunten.

Hoeveel bits heeft de veelgebruikte grote karakterset Unicode?

16.

Een veelgebruikte grote karakterset is Unicode. Deze is 16-bits en heeft dus 65.536 codepunten. Dit is echter nog steeds niet genoeg om ook alle Chinese, Japanse en Koreaanse karakters erbij te betrekken. Hoe is dit opgelost?

Door alle karakters in deze talen die er hetzelfde uitzien ook hetzelfde getal toe te wijzen, ongeacht of ze ook dezelfde betekenis hebben.

Waarvoor worden UCS Transformation Formats (UTF's) gebruikt?

Om de Unicode-standaard nog verder aan te passen, zodat deze meer karakters kan bieden of juist helemaal aansluit bij de ASCII-codering voor alle ASCII-karakters.

Wat is de bekendste USC Transformation Format (UTF)?

UTF-8. Dit is de karakterset die standaard gebruikt wordt op het internet.

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo