Jump to content

combined oder precombined als ergebnis von tastatureingaben?


Phoibos

Empfohlene Beiträge

Phoibos

moin,

da ich jetzt schon länger als 'ne stunde tante google beschäftige, ohne ein hilfreiches ergebnis zu erhalten, stelle ich die frage jetzt mal hier:

wenn ich über die tastatur akzent und buchstabe eingebe, ist das ergebnis dann eine combined-glyphe oder wandelt das betriebssystem das dann in einen precombined charakter um? und ist diese umwandlung betriebssystem spezifisch oder funktioniert sie unter allen betriebssystem gleich?

ciao

Link zum Beitrag
Mach

Ich glaube, das variiert nicht einfach nach Betriebsystem, sondern nach Betriebsystem/Programm. Unter Mac OS X verwendet zumindest Finder.app getrennte Charaktere für Basis-Glyphe und Akzent-Glyphe, wohl vor allem in der Absicht, die alphabetische Sortierung bzw. die Auffindbarkeit per Tastatur-Eingabe zu gewährleisten. Es gibt auch andere Programme, die es manchmal tun, jedenfalls habe ich beim Kopieren manchmal getrennte Charaktere, aber über die genaueren Umstände weiss ich nicht bescheid. Auf jeden Fall belassen gewöhnliche Textbearbeitungsprogramme die Charaktere, und auch die Eingabe über die Tastatur erlaubt sowohl die Einzelcharaktere als auch die Zusammensetzungen.

Wie es sich in anderen Systemen verhält, weiss ich nicht. Ich könnte mir aber vorstellen, dass ein solcher Eingriff in die Zusammensetzung der Charaktere eine Mac-Besonderheit sein könnte.

Aber halt, ich hatte auch schon grosse Mühe bei der Eingabe der spitzen Klammern «⟨» und «⟩», denn ich hatte versucht, die Charaktere U+2329 LEFT-POINTING ANGLE BRACKET «〈» und U+232A RIGHT-POINTING ANGLE BRACKET «〉» zu verwenden. In den Browser kopieren, dann schauen, was im Internet angezeigt wird: Es sind die Charaktere U+3008 und U+3009! Das hat aber damit zu tun, dass erstere als depracted eingestuft sind und nicht mehr verwendet werden sollten (ich hätte U+27E8 «⟨» und U+27E9 «⟩» verwenden sollen). Wo die Umwandlung der Charaktere geschieht, ist mir aber nicht klar. Firefox? Auf dem Webserver? Keine Ahnung; jedenfalls ist es ein ähnlicher Eingriff in die Zusammensetzung der Charaktere wie die Verwendung von separatem Akzent-Charakter statt zusammengesetztem Akzentbuchstaben.

Link zum Beitrag
  • 1 Monat später...
Georg Duffner

Ich bin erst jetzt zufällig darauf gestoßen, deshalb so spät eine Antwort.

Im Allgemeinen werden durch die Eingabe von Tottaste+Basisbuchstabe vorgefertigte Kombinationen ausgegeben. Was dabei rauskommt, ist von Ersetzungstabellen im Tastaturtreiber abhängig, und somit auch betriebssystemsezifisch. Unter Windows XP ist diese in den deutschen Standardtastaturen ziemlich kurz ausgefallen, deshalb gehen zB keine Kombinationen wie ^+´+a→ấ oder ´+s→ś. Wie die bei Mac OS X aussehen, kann ich nicht sagen, unter Linuxsystemen mit einem aktuellen X11 sind die im allgemeinen recht umfangreich und es werden auch exotischere Kombinationen problemlos erzeugt (wenn der Font die entsprechende vorkomponierte Codestelle besetzt hat).

Dass hierbei keine vorkombinierten Zeichen ausgegeben werden, ist sehr unwahrscheinlich, weil dafür die Reihenfolge umgedreht werden müsste. Die combining diacritics sind so gestaltet (und die Programme gehen mit denen auch dementsprechend um), dass zunächst der Basisbuchstabe eingegeben werden muss, und dann erst die kombinierenden Diakritika. Also zum Beispiel a+uni032D+uni0301→á̭ (a mit Circumflex draunter und Akut, nur sichtbar, wenn der Font diese Zeichen hat). Für diese Kombination gibt es codiert kein vorkomponiertes Zeichen.

Womit man es jetzt konkret zu tun hat, kann wohl nur herausgefunden werden, indem man den Binärcode studiert.

Edit: experimenteller Nachweis:

Bei echten Kombinationen funktioniert dementsprechend auch das Löschen: es wird nicht sofort das ganze kombinierte Zeichen gelöscht sondern jedes einzelne kombinierende Zeichen in der umgekehrten Reihenfolge, in der es eingegeben wurde. Bei unserem á̭ wird daraus also zuerst a̭, dann a und dann erst wird das a gelöscht.

Link zum Beitrag
Mach
Also zum Beispiel a+uni032D+uni0301→á̭ (a mit Circumflex draunter und Akut, nur sichtbar, wenn der Font diese Zeichen hat).

Das ist ein schönes Beispiel für den Eingriff der Normalisations-Regeln unter OS X: Wenn ich in Firefox diese Zeichen kopiere, so ergibt eine Untersuchung des kopierten Strings, dass er sich zusammensetzt aus den Charakteren U+00E1 (LATIN SMALL LETTER A WITH ACUTE, ⟨é⟩) und U+032D (COMBINING CIRCUMFLEX ACCENT BELOW). Dasselbe geschieht, wenn ich die von dir ursprünglich eingegebenen drei Charaktere U+0061 U+032D U+0301 zwischen verschiedenen OS-X-Programmen hin und her kopiere, ausgenommen wenige Programme wie TextWrangler oder UnicodeChecker, die speziell für die Manipulation von Charakteren gedacht sind.

Warum das geschieht, verstehe ich nicht im Detail. Es hat womöglich damit zu tun, das OS X eine andere Präferenz bezüglich zusammengesetzten Charakteren hat als die meisten anderen Systeme, nämlich eine Präferenz für Dekomposition (wobei allerdings das beobachtete Verhalten auf Firefox unter OS X das genaue Gegenteil ist).

Bei echten Kombinationen funktioniert dementsprechend auch das Löschen: es wird nicht sofort das ganze kombinierte Zeichen gelöscht sondern jedes einzelne kombinierende Zeichen in der umgekehrten Reihenfolge, in der es eingegeben wurde. Bei unserem á̭ wird daraus also zuerst a̭, dann a und dann erst wird das a gelöscht.

Das ist nicht so bei vielen Programmen unter OS X. Dort erfasst das einfache Löschen im Allgemeinen den letzten richtigen Buchstaben mitsamt allfälligen kombinierenden Akzenten.

Link zum Beitrag

Diskutiere mit …

Du kannst jetzt schreiben und dich später registrieren. Wenn du bereits einen Account hast, melde dich an, um von deinem Account aus zu schreiben.
Hinweis: Dein Beitrag muss von einem Moderator zunächst freigeschaltet werden.

Gast
Auf dieses Thema antworten ...

×   Du hast formatierten Text eingefügt.   Restore formatting

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

<p>Graublau Slab – Die Erweiterung zum Bestseller Graublau Sans</p>
<p>Graublau Slab – Die Erweiterung zum Bestseller Graublau Sans</p>
<p>Graublau Slab – Die Erweiterung zum Bestseller Graublau Sans</p>
<p>Graublau Slab – Die Erweiterung zum Bestseller Graublau Sans</p>
<p>Graublau Slab – Die Erweiterung zum Bestseller Graublau Sans</p>
<p>Graublau Slab – Die Erweiterung zum Bestseller Graublau Sans</p>
×
×
  • Neu erstellen...

Hinweis

Wie die meisten Websites, legt auch Typografie.info Cookies im Browser ab, um die Bedienung der Seite zu verbessern. Sie können die Cookie-Einstellungen des Browsers anpassen. Anderenfalls akzeptieren Sie bitte die Speicherung von Cookies. Weitere Details in der Datenschutzerklärung