Weblog • Peter Kröner • Webtechnologie

Im Kaninchenbau der Array-Erkennung

Veröffentlicht am 1. August 2023

Auf Twitter (die Älteren unter uns erinnern sich sicher noch) fragte Nikolaus: „Woran, wenn nicht am Prototypen, erkennt Array.isArray() Arrays“ und bekam von mir eine viel zu kurze Antwort. Es folgt in diesem Artikel die Langfassung!

Heutzutage ist Array-Erkennung ganz einfach: die Spezifikationen legen direkt fest, dass Array.isArray() Arrays erkennt! Genau genommen verweist die Definition von Array.isArray() auf die spezifikationsinterne Funktion IsArray(), die mehr oder minder sagt: wenn ich auf ein Array angewendet werde, gebe ich true aus, ansonsten false. Arrays sind in ECMAScript sehr klar von normalen Objekten abgegrenzte Spezial-Objekte (sogenannte „Array Exotic Objects“) und daher eigentlich ohne großen Aufwand zu identifizieren. Das war allerdings nicht immer so einfach.

Was ist eigentlich ein Array?

Arrays sind Allerwelts-Bausteine von fast jedem JavaScript-Programm... was genau macht sie exotisch? Zunächst mal nicht viel: Arrays sind zu 99% von normalen JavaScript-Objekten nicht zu unterscheiden. Wir können beliebige Felder definieren, Funktionen wie Object.keys() mit ihnen verwenden und Operationen wie delete funktionieren auch:

let arr = [];
arr.someField = 23;
console.log(arr.someField); // > 23
arr[0] = 42; // Auch nur ein Objekt-Feld
console.log(Object.hasOwn(arr, "someField")); // > true
console.log(Object.hasOwn(arr, 0)); // > true
delete arr.someField;
console.log(Object.hasOwn(arr, "someField")); // > false

Das einzig offensichtlich Spezielle an Arrays sind eine eigene Literal-Syntax ([] statt {}) und ein Prototyp, der Methoden wie push() und splice() bereitstellt. Wir kommen dem Funktionsumfang von Arrays sehr nahe, wenn wir einfach ein neues Objekt mit Array.prototype als Prototyp anlegen:

let fakeArray = Object.create(Array.prototype);
fakeArray.push(23);
console.log(fakeArray[0]); // > 23
console.log(fakeArray.length); // > 1

Unser Fake-Array hat Inhalt (numerische Objekt-Keys) und Methoden wie push() definieren nicht nur neue Felder, sondern erhöhen auch die length um die Anzahl der neuen Elemente. Ein echtes Array macht aber noch mehr:

let fakeArray = Object.create(Array.prototype);
let realArray = [];

fakeArray.push(23);
realArray.push(23);

console.log(fakeArray[0], realArray[0]); // > 23, 23
console.log(fakeArray.length, realArray.length); // > 1, 1

fakeArray[1] = 42;
realArray[1] = 42;

console.log(fakeArray[1], realArray[1]); // > 42, 42
console.log(fakeArray.length, realArray.length); // > 1, 2

realArray.length = 0;
fakeArray.length = 0;

console.log(fakeArray.length, realArray.length); // > 0, 0
console.log(fakeArray[0], realArray[0]); // > 23, undefined

Beim Fake-Array ändert sich die length bei der Benutzung von Methoden, nicht aber bei direktem setzen von Indizes (z.B. fakeArray[1] = 42). Umgekehrt führt ein setzen der length auf 0 beim echten Array zum Löschen des Inhalts, beim Fake-Array hingegen ändert sich nichts am Inhalt. Wie kann das sein? Mit Sicherheit ist doch length ein Getter/Setter-Paar, das Array-Inhalt zählt oder verändert, richtig?

let realArray = [];

console.log(Object.getOwnPropertyDescriptor(realArray, "length"));
// > { value: 0, ... } - KEIN Getter/Setter-Paar

realArray[5] = true;

console.log(Object.getOwnPropertyDescriptor(realArray, "length"));
// > { value: 6, ... } - Magisches Update für "length"!

Oh. Anscheinend ist length doch eine ganz normale Daten-Property auf Arrays und kein Getter/Setter-Paar auf dem Prototypen. Aber wie funktioniert length denn dann?

Exotic Objects

In der ECMAScript-Spezifikation existiert das Konzept des „Exotic Object“, das bestimmte Sorten von Objekt (z.B. Arrays) von „Ordinary Objects“ abgrenzt. Exotic Objects können in einer beliebigen Reihe von Weisen vom Verhalten der normalen Ordinary Objects und auf diese Weise „magische“ Features wie length auf Arrays umsetzen. Als Ordinary gelten jene Objekte, die eine bestimmte Liste von Algorithmen implementieren (plus ein paar Extras für Funktionen) und „Exotic Objects“ weichen von diesen Standard-Bausteinen ab.

Im Falle von Arrays ist der Algorithmus für das Setzen von Properties abweichend definiert:

Das Setzen der length verändert den Array-Inhalt
Das Setzen von numerischen Feldern (d.h. von Array-Indizies) verändert die length
Alles andere verhält sich wie bei normalen Objekten

Auf einem Array ein Feld wie z.B. arr.x = "Hello" zu definieren hat also den gleichen Effekt, als würden wir das auf einem normalen Objekt tun. Setzen wir jedoch arr[7] = 23, erhält length auf magische Weise ein automatisches Update und setzen wir die length auf einen neuen Wert, verändert sich der Array-Inhalte ebenso automagisch. Allein das Vorhandensein dieser einen Ausnahme für den Property-Set-Algorithmus erhebt Arrays in den exklusiven Club der Exotic Objects!

Die ECMAScript-Spezifikation untergliedert den Club der Exotic Objects anhand der diversen Non-Standard-Verhaltensweisen seiner Mitglieder noch weiter. Auf diese Weise kann die Spezifikation zwischen z.B. Arrays und Strings (die beide spezielle, aber unterschiedliche Operationen mit length und Indizes implementieren) auseinanderhalten. Allerdings passiert diese Unterscheidung allein auf der Ebene der Spezifikationen. Das Ziel der Specs ist, über präzise definierte Algorithmen ein bestimmtes beobachtbares Verhalten der Programmiersprache zu garantieren, doch die Algorithmen selbst sind nicht direkt aus JavaScript heraus beobachtbar. Wie mussten sehr genau hinsehen, um das besondere Verhalten von length überhaupt zu erkennen, und dieses Erkennen allein verrät uns nur, dass irgendwas besonderes los ist - was genau unter der Haube mit Array passiert, erklärt allein die Spezifikations-Lektüre.

Nun wissen wir, dass Arrays tatsächlich etwas besonderes sind: eine Subspezies einer besonderen Spezies von Objekt. Wie können wie diese Spezies jetzt in unserem normalen JS-Code von normalen Objekten unterscheiden?

Die Grenzen von Duck Typing und `instanceof`

Normalerweise ist Duck Typing das Mittel der Wahl, um in JavaScript den Typ von Objekten (näherungsweise) festzustellen, doch das funktioniert bei Arrays nicht besonders gut. Gerade aufgrund ihrer magischen length-Eigenschaft (anstelle eines Getter-Setter-Paars) sind Arrays von herkömmlichen Objekten kaum zu unterscheiden: ein überzeugendes Fake-Array mit numerischen Keys, Array.prototype und einer length-Eigenschaft ist, wie wir gesehen haben, schnell gebaut.

Eine denkbare Alternative zu Duck Typing ist instanceof, aber auch das hat seine Grenzen: wenn wir von Hacks, zu denen wir in Kürze kommen, erst mal absehen, liefert instanceof nur das richtige Ergebnis, wenn seine beiden Operanden aus dem gleichen Browsing Context (d.h. Fenster bzw. Frame) stammen:

// Array und Array-Constructor aus gleichem Frame
console.log([] instanceof Array); // > true
console.log(someFrame.contentWindow.arr instanceof someFrame.contentWindow.Array); // > true

  
// Array und Array-Constructor aus unterschiedlichen Frames
console.log([] instanceof someFrame.contentWindow.Array); // > false
console.log(someFrame.contentWindow.arr instanceof Array); // > false

Das ist ganz streng genommen nicht verwunderlich - Array und iframe.contentWindow.Array sind nun mal zwei unterschiedliche Objekte, und nur eins von beiden ist die Constructorfunktion von einem Array aus einem gegebenen Browsing Context. Hinzu kommt, dass wir mit @@hasInstance den instanceof-Operator ohnehin zu jedem beliebigen Ergebnis kommen lassen können:

class Yep {
  // Bestimmt das Ergebnis von "x instanceof Yep"
  static [Symbol.hasInstance]() {
    return true;
  }
}

console.log([] instanceof Yep); // > true
console.log({ foo: 42 } instanceof Yep); // > true

Und ja, streng genommen können wir den Array-Constructor so patchen, dass instanceof über Frame-Grenzen hinweg funktioniert:

// Normalerweise ist @@hasInstance auf Arrays nicht definiert...
Object.defineProperty(Array, Symbol.hasInstance, {
  value: (x) => Array.isArray(x)
});

Allerdings müssten wir innerhalb dieses Patches Array.isArray() benutzen, was uns auf der Suche nach einem Weg jenseits von Array.isArray() nicht wirklich weiterbringt. Für sich genommen ist und bleibt instanceof zur Array-Erkennung unbrauchbar und wir brauchen einen anderen, definitiven Weg, Arrays - die, egal aus welchem Frame stammend, nun mal Array Exotic Objects sind - zu identifizieren!

Der `[[Class]]`-Hack

Nachdem sich instanceof als nutzlos erwiesen hat, ist klar, wonach wir suchen: Wir brauchen einen Identifikationsmechanismus, der sich auf aus JS heraus zugängliche Aspekte stützt, die Array Exotic Objects eigen sind - unabhängig vom Browsing Context oder irgendwelchen Symbols auf irgendwelchen Klassen. Aus dieser Erkenntnis entstand in der grauen JavaScript-Vorzeit der folgende Hack:

let isArray = (x) => Object.prototype.toString.call(x) === "[object Array]"; // WTF?
console.log(isArray(42)); // false
console.log(isArray([])); // true

Wie funktioniert das? Im Prinzip per Informations-Leck! Normalerweise hat jede JavaScript-Objekt-Klasse seine eigene Implementierung von toString():

console.log({}.toString());
// > "[object Object]"
// Quelle: Object.prototype.toString()

console.log(function test(x) { return x * x; }.toString());
// > "function test(x) {return x * x;}"
// Quelle: Function.prototype.toString()

console.log([1, 2, 3].toString());
// > "1,2,3"
// Quelle: Array.prototype.toString()

Alle JavaScript-Objektklassen erben von Object.prototype und im Zuge dessen überschreiben sie die Basis-Implementierung von Object.prototype.toString() mit ihren eigenen Stringifizierungs-Algorithmen. Im Falle von Arrays stringifiziert dieser Algorithmus den Array-Inhalt und fügt ihn mit Kommata zusammen. Mittels Object.prototype.toString.call(someArray) umgehen wir aber diesen Array-eigenen Algorithmus und verwenden den Standard-Stringifizierungs-Algorithmus Object.prototype.toString() für unser Array. Und dieser Standard-Stringifizierungs-Algorithmus gibt nicht, wie viele glauben, einfach immer "[object Object]" aus!

Vor ECMAScript 2015 enthielten alle JavaScript-Objekte einen internen String-Wert namens [[Class]]. Die Doppeleckklammer-Notation ist die ECMAScript-Standard-Schreibweise für nicht-öffentliche Felder in Objekten. Ein so beschriebenes Feld ist ein reiner Spezifikationsmechanismus (vergleichbar mit den Non-Standard-Operationen von Exotic Objects) und sollte für Nutzer von JavaScript selbst nicht direkt beobachtbar sein. Soweit die Theorie.

In ES2015 und älter wurde [[Class]] allerdings in Object.prototype.toString zur Stringifizierung von Objekten verwendet! Einfach den Wert von [[Class]] in den String "[object XYZ]" an der Stelle von XYZ einsetzen und fertig! Bei ({}).toString() kam also nur deshalb"[object Object]" heraus, weil [[Class]] in Standard-Objekten eben "Object" war. Für Arrays, deren [[Class]] den Wert "Array" war, müsste also [object Array] herauskommen, doch da Arrays ihre eigene, [[Class]] ignorierende toString()-Implementierung mitbringen, passierte das im Normalfall nicht. Der einzige Weg, den [[Class]]-Wert eines Objekts mit eigener toString()-Implementierung sichtbar zu machen, besteht darin, das toString() von Object.prototype mittels call()-Methode auf die fraglichen Objekte anzuwenden.

Das Endergebnis war ein Hack, der eine löchrige Abstraktion in den ECMAScript-Spezifikationen ausnutzte. Die öffentliche Methode Object.prototype.toString erlaubte den Einblick in einen nichtöffentlichen Aspekt von der Spezifikationsmechaniken, womit wir Objekte genau wie die ES-Specs unterscheiden konnte. Das funktionierte mit Arrays und diversen anderen Standard-Objekt-Sorten recht zuverlässig, doch eine saubere Lösung zur Array-Erkennung sieht natürlich anders aus.

Der Weg zu `Array.isArray()`

Der Webentwickler-Community einen Mechanismus zur zweifelsfreien Identifikation von Arrays zu geben, war eine recht unkontroverse Idee. Anfangs (bis ES2015) stützte sich Array.isArray() noch auf [[Class]], doch später wurde das Regelwerk vereinfacht: true für Array Exotic Objects, andernfalls false. Das ändert im Endeffekt nicht viel, denn [[Class]] war genau so ein internes Spezifikationsdetail, wie es die Kategorie Array Exotic Object ist, doch am Ende ist es doch der etwas direktere Weg.

In heutigem ECMAScript existiert [[Class]] nicht mehr und Objekte (eingebaute wie auch in JS definierte) können ihre Stringifizierung per @@toStringTag selbst bestimmen. Alles, was von [[Class]] bleibt, sind ein paar zusätzliche Schritte in der heutigen Definition von Object.prototype.toString(), um Abwärtskompatibilität herzustellen. Array.isArray() erkennt seinesgleichen heutzutage ganz einfach per Definitionem und ist daher das am besten unhinterfragte Mittel der Wahl zur Array-Identifizierung. Klar, mit @@hasInstance aus dem Array-Constructor könnte JavaScript heutzutage Arrays auch über Frame-Grenzen per istanceof erkennbar machen, doch das lässt das Gebot der Abwärtskompatibilität natürlich nicht zu. Das wäre viel zu einfach.

TypeScript-Funktionen mit unknown-Parametern überladen - Wie, wann und warum

Veröffentlicht am 25. April 2023

Die Menge der Programmiersprachen-Features, die absolut radioaktiv sind und die niemand jemals benutzen sollte, ist meiner Überzeugung nach kleiner als viele glauben. Egal ob JavaScript-Features aus der Jungsteinzeit oder any in TypeScript, ich persönlich greife sehr gerne in die Mottenkiste, wenn es hilft, das aktuelle Problem zu lösen. Natürlich gehört zum Einsatz dieser... kontroversen Features immer auch der eine oder andere Safeguard, damit die immer auch vorhandenen negativen Aspekte der jeweiligen Features eingehegt werden. Aber selbst allgemein akzeptierte Sprachfeatures, selbst manche der komplett abgefeierten, haben Safeguard-Bedarf, denn auch sie können negative Auswirkungen haben. Das gilt unter anderem auch für unknown in TypeScript.

Selbstdisziplinierung mit `unknown`

Dem TypeScript-Typ unknown kann jeder andere Typ zugewiesen werden, aber er ist selbst nicht direkt benutzbar. Sinn und Zweck von unknown ist meist das Erzwingen eines Typechecks, wie z.B. im folgenden Beispiel:

function isString(input: unknown): boolean {
  return typeof input === "string";
}

In die Funktion isString() können wir jeden denkbaren Wert hineinstecken, denn einem Parameter von Typ unknown ist jeder andere Typ zuweisbar. Innerhalb der Funktion können wir aber mit input nichts anderes tun, als seinen eigentlichen Typ zu überprüfen (Type Narrowing, per Typcheck oder Vergleich) - andere Operationen sind mit unknown nicht zulässig. Im Prinzip würde als Parameter-Typ auch any funktionieren, denn input kann buchstäblich alles Mögliche sein. Allerdings passt in any nicht nur jeder Wert hinein, sondern mit any ist auch jede Operation möglich! Das bedeutet, dass wir versehentlich Fehler auslösen könnten:

function containsFooNumber(obj: any): boolean {
  return typeof obj.foo === "number"; // nachlässiger Typcheck nimmt an, dass obj nicht null/undefined ist
}

containsFooNumber({ foo: 42 }); // ok - true
containsFooNumber({ foo: "a" }); // ok - false
containsFooNumber({ bar: null }); // ok - false
containsFooNumber(undefined); // RUNTIME-FEHLER: cannot read "foo" of undefined

Tauschen wir any gegen unknown, kann die Funktion weiterhin mit allem möglichen Input gefüttert werden, doch wir sind gezwungen, die Funktion selbst umzuschreiben - der Zugriff auf obj.foo ist nur erlaubt, wenn wir sicherstellen, dass obj nicht null oder undefined ist:

// Nicht von TS akzeptiert
function containsFooNumber(obj: unknown): boolean {
  return typeof obj.foo === "number"; // TS: obj.foo geht nicht (obj ist unknown, d.h. ggf. null/undefined)
}

// Nur so funktioniert's
function containsFooNumber(obj: unknown): boolean {
  return (
    typeof obj === "object" &&
    obj !== null &&
    "foo" in obj &&
    typeof obj.foo === "number"
  );
}

Zusammengefasst können wir also sagen:

any kann alles zugewiesen werden und mit any kann alles gemacht werden
unknown kann alles zugewiesen werden und mit unknown kann nichts gemacht werden, außer es any/unknown zuzuweisen oder es in einen anderen Typ zu überführen

Als Selbstdisziplinierungsmaßnahme für die Autoren von Funktionen, die ihren Input einem Runtime-Typecheck unterziehen müssen/wollen, ist unknown also sehr nützlich. Aber welche Funktionen sind das eigentlich?

TypeScripts blinde Flecken

Wer TypeScript-Fans trollen möchte, kann ganz gut argumentieren, dass das gesamte Typsystem und all seine Features nur eine kollektive Illusion sind. Schließlich existieren TypeScript-Typen nur so lange, bis der Compiler aus den .ts-Dateien ganz normale .js-Dateien macht, in denen von TS nichts mehr zu sehen ist. Sobald es ernst wird und der Code tatsächlich laufen muss, sind sämtliche Typechecks nicht mehr vorhanden und theoretisch könnte es allerlei Fehler geben!

Darauf folgend müssen wir natürlich fragen, ob zu diesem Zeitpunkt noch Code existiert, der in Abwesenheit von Typechecks noch ein Problem auslösen kann. Ist das gesamte Projekt von vorn bis hinten in TypeScript geschrieben, entsteht schließlich nur Code, der alle Anforderungen des Typsystems erfüllt. Die Hürden des Typsystems werden zwar vom Compiler bei der Übersetzung von .ts nach .js abgebaut, aber es ist vorher nie Code entstanden, der in Abwesenheit dieser Hürden Fehler auslösen könnte. Die Typechecks sind zwar nicht mehr da, aber es ist kein Code entstanden, der diese Lücken ausnutzen könnte.

Das Problem hieran: kaum ein Projekt ist wirklich von vorn bis hinten in TypeScript geschrieben und selbst 100%-TS-Projekte müssen mit Systemen interagieren, die keine Typechecks haben. Dazu gehören:

Code ohne Typen, z.B. Dependencies mit schluderigem TS-Support oder eigener Code mit zu viel any
API-Endpunkte und Datenbanken, denn HTTP oder SQL werden nicht von TypeScript überprüft. Und selbst wenn die APIs oder Queries in TS geschrieben sind oder Typdefinitionen dafür gebaut/generiert wurden, entstehen die tatsächlichen Daten meist nicht unter den exakten Annahmen des angeflanschten Typsystems. Ein toll getypter HTTP-Endpunkt ist am Ende des Tages doch nur ein anderer Computer, auf dem alles mögliche los sein könnte.
JSON-Payloads z.B. aus LocalStorage könnten von alten Programmversionen erzeugt oder von Nutzern, Browser-Extensions oder sonstigen Dritten verändert worden sein.
Funktionsaufrufe von Dritten, die ggf. JavaScript statt TypeScript benutzen oder etwas zu freizügig any benutzen. Das ist besonders relevant, wenn das Projekt eine Library für den Einbau in anderen Projekten ist.

All diese blinden Flecken sind der Anlass, den Typ-Aluhut aufzusetzen und gründliche Runtime-Typchecks durchzuführen. Vertrauen ist gut, Kontrolle ist besser! Und zum Zweck der Selbstkontrolle verwenden wir unknown. Das könnte wie folgt aussehen:

type Options = {
  foo: number;
};

// Fehlschlagender Runtime-Typcheck wirft einen Fehler
function checkOptions(options: unknown): asserts options is Options {
  if (
    !options ||
    typeof options !== "object" ||
    !("foo" in options) ||
    typeof options.foo !== "number"
  ) {
    throw new TypeError("Runtime type check failed");
  }
}

// Öffentliche Funktion
export function publicFunction(options: unknown): void {
  // options hat hier den Typ "unknown"
  checkOptions(options);
  // options hat ab hier Typ "Options"
}

Unsere publicFunction() ist für den Einsatz durch Dritte gedacht und Dritten ist nicht zu trauen. Mit unknown zwingen wir uns innerhalb von publicFunction() zum Typecheck via checkOptions() und stellen damit zu 100% sicher, dass wir den options-Parameter erst anrühren, wenn wir sicher wissen, dass er exakt enthält, was wir erwarten.

Alles gut? Mitnichten! Denn falls Benutzer von publicFunction() TypeScript statt Vanilla JS verwenden, haben wir ihnen durch den Einsatz von unknown das Leben soeben schwerer statt leichter gemacht.

Die zwei Seiten von `unknown`

Einer der größten Vorteile von TypeScript ist die smarte Autovervollständigung, die uns z.B. bei einem Funktionsaufruf verrät (und überprüft), welche Parameter welchen Typ brauchen. Das Problem mit Funktionsparametern vom Typ unknown ist, dass dieses Feature uns dann auch tatsächlich unknown anzeigt:

Die Autovervollständigung zeigt an, dass ein Funktionsparameter vom Typ 'unknown' ist

Das ist zwar rein technisch korrekt, aber absolut nicht hilfreich. Die Funktion sollte definitiv mit Options gefüttert werden – unknown ist eine reine Vorsichtsmaßnahme! Die Vorsichtsmaßnahme verbirgt aber nun den eigentlichen Soll-Typ vor der Autovervollständigung. Und schlimmer noch: es gibt in der IDE nun auch keine keinerlei Typchecks mehr:

Eine TypeScript-Funktion akzeptiert einen offensichtlich zu einem Laufzeit-Fehler fürenden Wert, da er zu 'unknown' passt

Der Funktionsaufruf in Zeile 24 ist offensichtlich falsch und wird offensichtlich in einem Runtime-Fehler enden, doch der Editor sagt uns das nicht voraus – und das, obwohl der korrekte Typ nur wenige Zeilen vorher ordentlich definiert wurde.

Der Einsatz von unknown sorgt also im Endeffekt dafür, dass die Autoren von publicFunction() zwar vom Typsystem zur Durchführung eines Runtime-Typchecks angehalten werden, andererseits haben die Benutzer von publicFunction() keine sinnvolle Autovervollständigung mehr und auch keinerlei Typchecks (denn unknown kann jeden Wert zugewiesen bekommen). Anders gesagt: bei einer Funktion, die unknown als Parameter-Typ hat, profitieren die Autoren der Funktion von mehr Typsicherheit (sie können mit dem Parameter keinen Blödsinn anstellen), die Benutzer der Funktion haben praktisch gar keine Typsicherheit mehr. Das ist alles logisch und nachvollziehbar, aber alles andere als akzeptabel.

Die Lösung: `unknown` aus aufrufbaren Signaturen verbannen!

Meine Schlussfolgerung aus dem beschriebenen Problem mit unknown ist, dass Funktionen mit unknown als Parameter ein extrem heißer Kandidat für einen Overload sein sollten:

export function publicFunction(options: Options): void;
export function publicFunction(options: unknown): void {
}

Ein Overload einer Funktion ist in TypeScript eine alternative Funktionssignatur. Die eigentliche Funktionssignatur beschreibt die Implementierung, die Overloads beschreiben die (ggf. vielen verschiedenen) Aufruf-Signaturen, die durch die Implementierung umgesetzt werden. Hierbei können die Overloads durchaus restriktivere Signaturen bereitstellen, als die Implementierung eigentlich unterstützen würde:

function addOrConcat(a: string, b: string): string;
function addOrConcat(a: number, b: number): number;
function addOrConcat(a: bigint, b: bigint): bigint;
function addOrConcat(a: string | number | bigint, b: string | number | bigint): string | number | bigint {
  if (typeof a === "string" || typeof b === "string") {
    return String(a) + String(b);
  }
  if (typeof a === "bigint" || typeof b === "bigint") {
    return BigInt(a) + BigInt(b);
  }
  return a + b;
}

addOrConcat() hat dank seiner Overloads drei Signaturen, die aufgerufen werden können:

(string, string) => string
(number, number) => number
(bigint, bigint) => bigint

Die Implementierung würde, reiner JavaScript-Logik folgend, auch andere Aufrufe wie etwa (string, bigint) => string unterstützen, aber die Overloads bieten nur die drei obigen Signaturen an; der theoretische Aufruf von (string, bigint) => string wird vom Compiler nicht akzeptiert. Dieser Aufruf würde zwar auf die Implementierungssignatur der Funktion passen, doch diese ist gewissermaßen privat und nur innerhalb der Funktion für die lokalen Typen von a und b relevant.

Das bedeutet für unsere publicFunction(), dass wir zeitgleich eine Implementierungssignatur mit unknown und eine Aufrufsignatur mit Options haben können! Innerhalb von publicFunction() zwingen wir uns zur Runtime-Überprüfung der Parameter, Aufrufende können diese Überprüfung zur Entwicklungs-Zeit vom Typsystem machen lassen:

export function publicFunction(options: Options): void;
export function publicFunction(options: unknown): void {
  // Hier ist options "unknown"
}

publicFunction(/* hier ist options "Options" */);

Wer TS nutzt, hat die erwartete Developer Experience, wer TS nicht nutzt (oder zu viel any verwendet), wird über Fehler erst (aber auch sicher) zur Laufzeit informiert. Alle Parteien haben die aus ihrer jeweiligen Perspektive korrekten Typchecks und die maximal mögliche Unterstützung ihrer IDE. Win-Win!

Bedingungen für `unknown`-Overloads

Es versteht sich von selbst, dass nicht jede Funktion mit unknwon einen Overload mit einem anderen Typ braucht. Zunächst mal braucht es für einen solchen Overload überhaupt einen passenderen Typen – und der ist nicht immer gegeben. Reine Typ-Überprüf-Funktionen haben prinzipbedingt unbekannte Typen als Parameter:

// der Parameter-Typ ist prinzipbedingt unbekannt
function isString(input: unknown): boolean {
  return typeof input === "string";
}

Zweitens ist es für einen Overload erforderlich, dass überhaupt jemand von dem Overload profitieren kann. Und das ist nicht der Fall, wenn die unbekannten Daten aus einem der erwähten blinden Flecken von TypeScript stammen:

function getSomeDataFromSomewhere(): unknown {
 // unwichtig
}

function checkAndProcessData(input: unknown): void {
  // unwichtig
}

function main(): void {
  checkAndProcessData(getSomeDataFromSomewhere());
}

Der unbekannte Input von checkAndProcessData() ist, ähnlich wie bei Typ-Überprüf-Funktionen, prinzipbedingt unbekannt, wenngleich er theoretisch einen bestimmten Typ haben sollte. Wir verwenden unknown allein, weil der Datenquelle getSomeDataFromSomewhere() nicht zu trauen ist, da diese ihre Daten aus einem von TypeScript blinden Flecken bezieht. Wir sparen uns an dieser Stelle den Overload, da es keinen menschlichen Nutzer gibt, der jemand davon profitieren könnte. Der Input für checkAndProcessData() kommt immer direkt aus getSomeDataFromSomewhere(), ist aus Vorsichtsgründen immer unknown, und wird niemals von Hand ausgeschrieben. Niemandes Autovervollständigung ist durch dieses unknown jemals beeinträchtigt.

Fazit

In der Hauptsache sind Overloads für Funktionen mit unknown-Parameter etwas für öffentliche Funktionen mit potenziellen menschlichen Nutzern. Das betrifft vor allem Libraries, aber auch API- und Service-Endpunkte aller Art; alle Funktionen, in denen wir uns als Autoren der Funktion zu gründlichen Runtime-Typchecks animieren möchten, ohne der TypeScript-Nutzerschaft die Developer Experience zu runinieren. unknown allein ist nützlich, hat aber notwendigerweise auch zur Folge, dass die Compile-Time-Typechecks für die Benutzer der betroffenen Funktionen kaputtgehen. Um das zu reparieren, brauchen meiner Meinung nach die entsprechenden Funktionen immer eine explizite Aufruf-Signatur ohne unknown und eine Implementierungssignatur mit unknown.

Canvas-Hardwarebeschleunigung per JavaScript selektiv abschalten

Veröffentlicht am 31. Januar 2023

Der Edge rendert auf manchen Laptops PDFs komisch, wenn Hardwarebeschleunigung an ist, sprach der Kunde zu mir und blickte hoffnungsvoll. Und es stimmte – oft (nicht immer), wenn Edge auf den gerade frisch in seiner Firma ausgerollten Laptops (nicht den alten Laptops) ein PDF in der Inhouse-Webapp zu rendern versuchte, waren einzelne Buchstaben entweder ganz unsichtbar oder es fehlte die Hälfte der relevanten Pixel. Sobald die Hardwarebeschleunigung in den Browser-Optionen abgeschaltet war, sah alles wunderbar aus. Das Problem trat ausschließlich auf den neuen Laptops auf, ausschließlich bei aktivierter Hardwarebeschleunigung und ausschließlich im Edge, bei nicht allen, aber vielen PDFs.

Anders als die initiale Beschreibung des Bugs vermuten lässt, war es gar nicht so schwer, für das Problem einen passenden Workaround zu bauen: einfach die modernsten DOM-APIs mit den übelsten JavaScript-Worst-Practices der Jungsteinzeit kombinieren und schon ist perfektes PDF-Rendering gesichert!

Ursachensuche

Etwas wie der beschriebene Rendering-Bug konnte eigentlich nicht an irgendwelchem JavaScript aus der Feder meines Kunden liegen, da das überwiegend aus pragmatischem Glue Code für diverse Libraries besteht. Also war an der Zeit, die Dependencies zu durchkämmen, was die eigentliche Ursache des Problems schnell zutage förderte. Das PDF-Rendering in der Webapp übernimmt PDF.js (als eine Dependency einer Dependency einer anderen Dependency) und der Bugtracker von PDF.js ist nicht arm an Meldungen des genau gleichen Problems (Beispiel 1, Beispiel 2). Die eigentliche Ursache für den Bug ist aber nicht PDF.js selbst, sondern ein Glitch in der Rendering-Engine des Browsers.

Das Ergebnis der Ursachenforschung ist also: um das Problem wirklich zu reparieren, müssten die C++-Ninjas im Chrome/Blink-Team auf den Plan gerufen werden. Da das, selbst wenn es zeitnah in einem Bugfix münden sollte, vermutlich eine lange Rollout-Phase nach sich ziehen würde, brauchten wir zur Behandlung des akuten Problems einen JavaScript-basierten Workaround. Am einfachsten wäre es, per JS die Hardwarebeschleunigung zu deaktivieren, sollte sich das als machbar herausstellen. Und siehe da: das geht tatsächlich!

Pro und Contra von Canvas-Hardwarebeschleunigung

Im Kontext von Webbrowsern bedeutet Hardwarebeschleunigung, den Hauptprozessor zu entlasten, indem Rendering-Aufgaben an den dezidierten Grafik-Chip (sofern vorhanden) des Rechners übergeben werden. Der Grafik-Chip ist auf Renderei spezialisiert und deshalb darin viel flotter als die generalistische CPU, wovon sowohl CSS als auch Canvas-Elemente profitieren können. Anders als bei CSS ist allerdings Rendering nicht die einzige Aufgabe, die ein Canvas-Element wahrnehmen kann.

Das Canvas-Element unterstützt diverse APIs für Operationen rund um Grafik. Von diesen APIs haben allerdings längst nicht alle etwas mit dem Anzeigen irgendwelcher Pixel zu tun! Wenn wir beispielsweise in JavaScript-Zugriff auf die rohen Pixeldaten von Bilden brauchen, ist das Canvas-Element das Mittel der Wahl:

function loadImage(src) {
  return new Promise((resolve) => {
    const img = new Image();
    img.src = src;
    img.onload = () => resolve(img);
  });
}

// JPEG laden
const img = await loadImage("image.jpg");

// Nicht in DOM eingehängtes Canvas-Element erzeugen
const canvas = document.createElement("canvas");
canvas.width = 300;
canvas.height = 300;

// 2D-API
const ctx = canvas.getContext("2d");

// Bild auf (unsichtbare) Canvas zeichnen
ctx.drawImage(img, 0, 0);

// Pixeldaten abrufen
const imgData = ctx.getImageData(0, 0, canvas.width, canvas.height);

// RGB-Werte invertieren
let i = 0;
while (i < imgData.data.length) {
  imgData.data[i] = 255 - imgData.data[i++]; // r
  imgData.data[i] = 255 - imgData.data[i++]; // g
  imgData.data[i] = 255 - imgData.data[i++]; // b
  i++; // a
}

// Invertierte Pixeldaten auf Canvas zeichnen
ctx.putImageData(imgData, 0, 0);

// Export als Data-URL, Anzeige als Image-Element
canvas.toBlob(async (blob) => {
  document.body.append(await loadImage(URL.createObjectURL(blob)));
});

Wichtig hier: das Canvas-Element ist zu keinem Zeitpunkt sichtbar, da es auch nicht angezeigt werden muss! Wir nutzen seine 2D-APIs (v.a. getImageData()), um die Pixeldaten des geladenen JPEG-Bildes in die Finger zu bekommen, die wir daraufhin invertieren und exportieren. Das Canvas-Element rendert nie etwas sichtbar auf den Bildschirm.

Für diesen Anwendungsfall ist Hardwarebeschleunigung tatsächlich eher Fluch als Segen. Die Benutzung von getImageData() und toBlob() führt dazu, dass bei aktivierter Hardwarebeschleunigung Daten häufig zwischen CPU und GPU hin- und hergeschoben werden müssen, was (je nach Workload) den Vorteil der flotteren GPU zunichtemacht. Damit das nicht sein muss, gibt es mit der Option willReadFrequently ein Opt-Out aus der Hardwarebeschleunigung für 2D-Canvas:

// 2D-API mit Optimierung für Readbacks
const ctx = canvas.getContext("2d", {
  willReadFrequently: true,
});

Der relevante normative Teil der HTML-Spezifikation nennt den Effekt von willReadFrequently nicht direkt ein „ein Opt-Out aus der Hardwarebeschleunigung“, sondern definiert den Effekt als:

When a CanvasRenderingContext2D object's willReadFrequently is true, the user agent may optimize the canvas for readback operations.

Die direkt auf den obigen Satz folgende nicht-normative Anmerkung sowie auch die MDN-Doku zu getContext() nennen das Kind aber beim Namen: willReadFrequently aktiviert Software-Rendering, damit Readbacks schneller werden … und vielleicht auch, damit lästige Rendering-Bugs mit PDF.js verschwinden?

Canvas-Hardwarebeschleunigung per JavaScript selektiv deaktivieren

Es ist nicht die Aufgabe von PDF.js, Rendering-Bugs in Chrome und Chrome-Derivaten zu reparieren. Deshalb ist es gut und richtig, dass in der Library alle Aufrufe von getContext() ohne willReadFrequently daherkommen - der Job von PDF.js ist das zügige Rendern von PDFs und Hardwarebeschleunigung hilft dabei. Aus der Sicht meines Kunden (speziell aus der Sicht der für die Webapp zuständigen Abteilung) ist das freilich anders: Ihr Job ist es, fehlerfrei PDFs in Edge anzuzeigen - und zwar jetzt, nicht erst, wenn Browserbugs gefixt und ausgerollt sind.

Statt PDF.js zu patchen und damit zukünftige Updates der Library zu verunmöglichen, habe ich folgende, dezent haarsträubende Lösung vorgeschlagen:

(function() {
  "use strict";
  const originalGetContext = HTMLCanvasElement.prototype.getContext;
  function patchedGetContext(contextType, contextAttributes = {}) {
    return originalGetContext.call(
      this,
      contextType,
      { ...contextAttributes, willReadFrequently: true }
    );
  }
  HTMLCanvasElement.prototype.getContext = patchedGetContext;
})();

Dieser Code (ummantelt mit einer legacy-konformen IIFE nach Art der Vorväter) überschreibt kurzerhand die getContext()-Methode aller Canvas-Elemente mit einer Variante, die willReadFrequently immer auf true setzt.

Eigentlich versteht sich von selbst, dass man nicht auf diese Weise Prototypen von irgendwelchen Objekten patchen sollte:

Prototype-Patching verändert die betroffenen Objekte für alle Scripts in der Webseite, nicht nur für die Code-Abschnitte, die wir verändern wollen
Prototype-Patching ist langsam, auch jenseits von allen Überlegungen zum konkreten Hardware-Beschleunigungsproblem
Prototype-Patching kann bei der Einführung neuer JS-Features unangenehme Kollisionsprobleme mit sich bringen

Aber keine Regel ohne Ausnahme! Ich würde behaupten, dass der obige Code für das akut bestehende PDF-Render-Problem der am wenigsten schlechte Workaround ist, denn:

das betroffene Modul der betroffenen Webapp lebt aus einer Reihe von Gründen in einem Iframe. Dieser bildet eine eigene kleine Sandbox, weswegen nicht alle Canvas-Elemente im kompletten Projekt betroffen sind. Das Team mit dem PDF-Problem verändert nur jene Canvas-Elemente, die es auch verantwortet (wenn auch von diesen Canvas-Elementen tatsächlich alle).
selbst wenn alle Canvas-Elemente im Projekt betroffen wären, ist aktuell das schlimmste, was passieren könnte, nachlassende Performance beim Rendering. Langsam, korrekt gerenderte Webapps sind aber besser als schnell falsch gerenderte Webapps, also ist das ein akzeptabler Tradeoff! Zwar könnten zukünftige Änderungen an Standards und Browsern zu Problemen führen, aber ...
...der Code ist für leichtes Löschen optimiert. Er befindet sich in einer Extra-Datei mit einem erklärenden Kommentar inkl. Datumsangabe und Verweis auf den Browser-Bug, der die eigentliche Ursache des Problems ist. Wer auch immer über den Code stolpert, sei es aus Zufall oder auf der Suche nach einem zukünftig entstehenden Problem, kann sofort entscheiden, ob das Modul gelöscht werden kann oder unter welchen Voraussetzungen nach einem neuen Workaround gesucht werden muss.

Für die gegebenen Umstände, unter denen ein akutes Problem schnell und ökonomisch aus der Welt zu schaffen war, halte ich den Code für die perfekt passende Lösung.

Fazit und Ausblick

Nach dem Ausrollen des gezeigten Workarounds ist das PDF-Anzeige-Proble meines Kunden behoben und die Webapp funktioniert, ohne dass die Browser der Nutzer speziell konfiguriert werden müssen. Eine echte Lösung des Problems bestünde in Änderungen an der Rendering-Engine der Browser oder ein Update aller im Unternehmen verwendeten PDFs – beides ist, wenn überhaupt möglich, nicht der Job des Webapp-Teams. Also bleiben nur unglamouröse Workarounds wie das Verändern von PDF.js oder des Canvas-Prototypen. Bei letzterem besteht zumindest eine gute Chance, dass zwischen Einbau und Löschung des Workarounds keine weiteren Probleme auftauchen. Und für den Fall dass doch, sind die Gründe für das Vorhandensein des Workarounds, seine etwas obskure Funktionsweise und die Bedingungen für seine Löschung (inkl. Verweis auf die relevanten Issues in den Bugtrackern der Browser) in Kommentaren lang und breit dokumentiert.

Für mich persönlich war es sehr schön, mal wieder das eingestaubte Wissen rund um Prototypen, this und Function.prototype.call zur Anwendung bringen zu können. In einer Welt, in der katastrophale Browser-Inkonsistenzen selten geworden sind und in der JS-OOP über Klassen extrem einfach geworden ist, kommt man kaum noch dazu, handgeknotete Prototyp-Ketten und Funktionsverbiegungen zu jonglieren. Was zwar alles in allem ein echter und unbestreitbarer Fortschritt ist, aber irgendwo auch ein klein wenig langweilt.

Die famose Fail-Funktion!

Veröffentlicht am 4. Januar 2023

In der Programmierung sind es immer die kleinen Dinge, die einen entweder in die Schreibtischplatte beißen lassen oder das Coding sehr viel angenehmer machen. In die zweite Kategorie fällt für mich die einfache, aber effektive Fail-Funktion. Diese schleppe ich schon seit Jahren mit mir herum und verwende sie in praktisch jedem Projekt oder Experiment, das mehr als 20 Zeilen JavaScript enthält.

Die Fail-Funktion macht nicht viel, leistet aber einiges. Eigentlich besteht sie nur aus drei Zeilen:

function fail(reason, ErrorConstructor = Error) {
  throw new ErrorConstructor(reason);
}

In Worten: die Fail-Funktion wirft einen Fehler! Mit dem optionalen ersten Parameter kann die Fehlermeldung angepasst werden (wird der Parameter ausgelassen, ist die Meldung ein leerer String), der optionale zweite Parameter erlaubt die Wahl des Fehler-Typs. Wenn wir etwas anderes als einen herkömmlichen Error haben wollen, können wir als zweiten Parameter einen alternativen Error-Typ wie z.B. TypeError angeben. Mehr passiert in dieser Funktion nicht!

Wann immer ich die Fail-Funktion anpreise, ernte ich zunächst Unverständnis: warum sollten wir eine Funktion schreiben (oder uns als Dependency ans Bein binden), die nichts tut, als einen Fehler zu werfen? Kann man nicht einfach direkt den Fehler auslösen? Was bringt uns der fail()-Wrapper?

Warum eine Fail-Funktion?

Tatsächlich können wir in JavaScript Stand 2022 nicht „einfach direkt den Fehler werfen“ - zumindest nicht in allen Fällen. Aufrufe der Fail-Funktion können nämlich an Stellen im Programm vorkommen, an denen kein throw-Statement stehen darf. Ein Beispiel zur Verdeutlichung:

let [value] = [];
if (typeof value === "undefined") {
  throw new Error("Got no value!");
}

Dieses Destructuring Assignment soll einen Wert aus einem iterierbaren Objekt (hier einem Array) extrahieren und falls es keinen Wert zum Herausziehen gibt, soll es einen Fehler geben. Mit der Fail-Funktion lässt sich das Gleiche in viel kürzer ausdrücken:

let [value = fail("Got no value!")] = []; // Error: Got no value!

Für Destructuring Assignments können wir in JavaScript seit Anbeginn der Zeiten Default-Werte angeben und es greift hier lazy evaluation: Die JavaScript-Engine schaut sich die rechte Seite des Gleichheitszeichens nur an, wenn sie auf der linken Seite ein undefined vorfindet. Normalerweise ist die Idee, der linken Seite einen Standard-Wert mitzugeben ...

let [value = 42] = []; // value === 42

... damit value niemals leer ausgeht. Doch wir können stattdessen, wenn wir keinen Default-Wert vergeben wollen, mithilfe der Fail-Funktion über den gleichen Mechanismus einen Fehler auslösen! Auf diese Weise können wir kompakt und bequem erzwingen, dass das Array immer mindestens einen Wert enthält (und dieser Wert in der Variable value landet).

Die Fail-Funktion kann diese Aufgabe übernehmen, weil ein Funktionsaufruf ein Ausdruck ist, während throw ein Statement ist (ersteres produziert einen Wert, zweiteres nicht; siehe Dr. Axels Erklärung zum genauen Unterschied). Und ein Ausdruck darf in JS-Programmen an vielen Stellen stehen, an denen ein Statement nichts verloren hat. Der folgende Code versucht, mittels eines direkten throw-Statements das Gleiche wie die Fail-Funktion zu erreichen, ist aber Stand 2022 syntaktisch nicht zulässig:

// SyntaxError
let [value = throw new Error("Got no value!")] = [];

Der Wert der Fail-Funktion besteht also kurz gesagt darin, dass sie ein Statement in einen Ausdruck verpackt und damit syntaktisch legalisiert, was normalerweise nicht erlaubt ist.

Der universeller Happy-Path-Eingrenzer

Die Preisfrage bei dem obigen Destructuring-Beispiel ist natürlich: hilft uns die Fail-Funktion an dieser Stelle, oder macht sie einen einfachen Programmablauf (wenn kein Wert, dann ein Fehler) im Vergleich zu einem If-Statement nicht eher kryptisch und übermäßig kompakt? Ich würde das mit Vehemenz bestreiten! Zahlreiche Szenarien sind mit der Fail-Funktion viel bequemer auszudrücken als auf jede andere Weise.

Szenario 1: eine Funktion mit drei Pflichtparametern:

function requiresThreeArguments(a, b, c) {}

Wie können wir sicherstellen, dass die Funktion auch tatsächlich mit allen drei Parametern aufgerufen wurde? In JavaScript hält uns im Prinzip nichts davon ab, beliebige Funktionen mit beliebig vielen beliebigen Parametern aufzurufen - ein Parameter wird erst dann zu einer Pflichtangabe, wenn wir ihn in der Funktion entsprechend überprüfen. Und das könnten wir über diverse Permutationen von If-Abfragen bewerkstelligen:

function requiresThreeArguments(a, b, c) {
  if (typeof a === "undefined") {
    throw new Error("a is required");
  }
  if (typeof b === "undefined") {
    throw new Error("b is required");
  }
  if (typeof c === "undefined") {
    throw new Error("c is required");
  }
}

Wenn wir der Meinung sind, auf sinnvolle Fehlermeldungen verzichten zu können (warum sollte man auch wissen wollen, welcher Parameter fehlt?), können wir die If-Kaskade auf ein einziges Statement eindampfen:

function requiresThreeArguments(a, b, c) {
  if (typeof a === "undefined" || typeof b === "undefined" || typeof c === "undefined") {
    throw new Error("something is missing");
  }
}

Besonders brillant finde ich weder die erste, noch die zweite Variante. Entweder ist es mir deutlich zu viel Code (Variante 1) oder die Fehlermeldungen sind zu unspezifisch (Variante 2). Und eigentlich ist mir auch Variante 2 zu viel Code! Ich möchte einfach nur - ohne zu TypeScript greifen zu müssen - eine Annotation an den Funktionsparametern haben, statt den Funktionsblock mit zusätzlichem Code zu verlängern. Aber zum Glück haben wir ja die Fail-Funktion!

function requiresThreeArguments(
  a = fail("a is required"),
  b = fail("b is required"),
  c = fail("c is required")
) {}

Das ist nicht nur in den meisten Fällen einfach kürzer, sondern bereinigt vor allem den Funktionsblock! Um das ganze noch etwas zu perfektionieren, könnten wir von fail() eine Variante ableiten, die einen schöneren Namen hat und standardmäßig einen passenderen TypeError durch die Gegend wirft:

const required = (reason) => fail(reason, TypeError);

function requiresThreeArguments(
  a = required("a is required"),
  b = required("b is required"),
  c = required("c is required")
) {}

Kompakt, lesbar und mit minimalen JavaScript-Bordmitteln umgesetzt, was will man mehr?

Das Konzept lässt sich auch bequem auf Objekte aller Art anwenden:

// Im Destructuring Assignment
let [value = fail("Got no value!")] = someIterableObject;

// Bei normalem Objektzugriff in Kombination mit ??
let value = someObject.value ?? fail("Got no value!")];

// Bei Maps in Kombination mit ??
let value = someMap.get("key") ?? fail("Got no value!")];

Gerade wenn wir doch mal in TypeScript unterwegs sind, ist die Fail Funktion in Kombination mit dem Nullish coalescing operator (??) Gold wert.

Die Fail-Funktion für TypeScript

Mit TypeScript-Typannotationen sieht die Funktion wie folgt aus:

export function fail(reason?: string, ErrorConstructor = Error): never {
  throw new ErrorConstructor(reason);
}

Der Rückgabetyp never der Funktion ist dabei der Schlüssel für Type Narrowing. Wird eine Funktion mit Rückgabetyp never aufgerufen, weiß TypeScript, dass das Programm in Folge nicht mehr weitergeht. Unter anderem wäre das der Fall, wenn eine Endlosschleife betreten wird oder wenn ein Fehler geworfen wird. Und wenn die Frage, ob das Programm weiter geht oder nicht, mit dem Typ einer bestimmten Variable zusammenhängt, dann ...

declare var myFoo: { value: number | undefined };

let val1 = myFoo.value;
// Typ von val1: number | undefined

let val2 = myFoo.value ?? fail();
// Typ von val2: number

Der Typ von val2 ist number, da fail(), wenn aufgerufen, zum Ende Programms führt - und das passiert nur, wenn myFoo.value entweder null oder undefined ist. Ist myFoo.value etwas anderes, wird die rechte Seite von ?? nicht ausgeführt und der Nachweis ist erbracht, dass val2, vom Typ number sein muss. Andernfalls würde das Programm (oder zumindest die aktuelle Funktion) per Error abrupt enden, was TypeScript problemlos nachvollzieht. Type Narrowing in Aktion!

Das ist nützlich, da das strikte Typsystem manche Programmabläufe nicht nachvollziehen kann und deshalb manchmal sehr vorsichtig mit der Typvergabe ist. Ein absolutes Extrembeispiel:

let map = new Map<string, number>();
map.set("key", 42);
let result = map.get("key");
// Typ von result: number | undefined

Es gibt keine Macht auf diesem Planeten, die verhindern kann, dass in diesem Beispiel result am Ende des Tages 42 enthält. Der Programmablauf kann unter keinen Umständen dazu führen, dass am Ende für map.get("key") ein undefined herauskommt, aber das ist nur klar, wenn wir alle drei Zeilen auf einmal betrachten und wissen, dass zwischendurch nichts anderes mit der Map passiert. Wir könnten natürlich eine Zeile einfügen, die das Undefined-Risiko wieder heraufbeschwört ...

let map = new Map<string, number>();
map.set("key", 42);
if (Math.random() < 0.1) { // Yolo
  map.delete("key");
}
let result = map.get("key");
// Typ von result: number | undefined

... aber wenn wir das nicht machen, wissen wir, dass result eine Zahl enthalten wird und TypeScript übervorsichtiges number | undefined steht uns im Weg herum. Was tun? Fail-Funktion benutzen!

let map = new Map<string, number>();
map.set("key", 42);
let result = map.get("key") ?? fail();
// Typ von result: number

Die Fail-Funktion erreicht an dieser Stelle zwei Dinge. Zum einen betreibt sie Type Narrowing. Dank der never-Rückgabetyp-Annotation der Fail-Funktion weiß TypeScript, dass das Programm endet, wenn sie aufgerufen wird und da das nur passiert, wenn auf der linken Seite von ?? entweder null oder undefined steht, weiß TS, dass wenn das Programm nicht endet, in result weder null noch undefined stehen können. Aus dem eigentlichen number | undefined, das wir aus get() bekommen, wird also number. Und sollte, auf welche Weise auch immer, für result wirklich einmal keine Zahl herauskommen, gibt es einen Fehler, der uns sofort zur verantwortlichen Zeile führt. Auf diese Weise führt die Fail-Funktion zu einem Zugewinn an Sicherheit (verglichen mit einer Type-Assertion as number) und, per Type Narrowing zu einer Verbesserung der Ergonomie. Win-Win!

Fazit und Ausblick

Obwohl die Fail-Funktion nur drei Zeilen hat, leistet sie viel: Code wird kompakter, sicherer und (im Kontext von TypeScript) sehr viel weniger lästig. Ist die Fail-Funktion also uneingeschränkt großartig und sollte von uns allen stets und ständig verwendet werden? Stand jetzt schon, aber sie könnte in Zukunft überflüssig werden.

Das Einzige, was noch besser als die Fail-Funktion wäre, wäre wenn wir ohne eine Extra-Funktion Fehler an Ausdrucks-Positionen werfen könnten und TC39 arbeitet tatsächlich an einem entsprechenden Feature! Die neue throw-Expression ließe sich genau so verwenden wie die Fail-Funktion, wäre aber ein neues, natives Feature:

function requiresThreeArguments(
  a = throw new TypeError("a is required"),
  b = throw new TypeError("b is required"),
  c = throw new TypeError("c is required")
) {}

throw in diesem Kontext sieht genau so aus, wie ein throw-Statement, ist aber ein Ausdruck und daher technisch gesehen etwas anderes. Benutzen ließe sich aber beides auf die gleiche Weise. Throw-Expressions hätten diverse kleine Vorteile gegenüber der Fail-Funktion und würden nur überschaubare Anpassungen an der ECMAScript-Grammatik benötigen. Da das Proposal aber nun schon seit Jahren im Limbo zwischen Stage 2 und 3 herumeiert, werden wir bis auf Weiteres der Fail-Funktion bleiben müssen.

Was ist eigentlich ein Array?

Exotic Objects

Die Grenzen von Duck Typing und instanceof

Der [[Class]]-Hack

Der Weg zu Array.isArray()

Selbstdisziplinierung mit unknown

TypeScripts blinde Flecken

Die zwei Seiten von unknown

Die Lösung: unknown aus aufrufbaren Signaturen verbannen!

Bedingungen für unknown-Overloads

Fazit

Ursachensuche

Pro und Contra von Canvas-Hardwarebeschleunigung

Canvas-Hardwarebeschleunigung per JavaScript selektiv deaktivieren

Fazit und Ausblick

Warum eine Fail-Funktion?

Der universeller Happy-Path-Eingrenzer

Die Fail-Funktion für TypeScript

Fazit und Ausblick

Die Grenzen von Duck Typing und `instanceof`

Der `[[Class]]`-Hack

Der Weg zu `Array.isArray()`

Selbstdisziplinierung mit `unknown`

Die zwei Seiten von `unknown`

Die Lösung: `unknown` aus aufrufbaren Signaturen verbannen!

Bedingungen für `unknown`-Overloads