Digital Humanities Werkzeuge für Daten in nicht-lateinischen Schriften
Eine Liste mit digitalen Werkzeugen, von denen die meisten für Daten in nicht-lateinischen Schriften ausgelegt sein sollen. Die Liste befindet sich in der Entwicklung, sie ist weder vollständig noch wurde jedes Werkzeug überprüft. (Letztes Update: August 2018)
Für Ergänzungen oder Hinweise kontaktieren Sie uns gerne unter fdm@campusbib.fu-berlin.de.
Textanalyse
Nur mit Firefox nutzbar, gibt für einzelne Wortformen (aktuell Latein, Griechisch, Arabisch) Informationen zu Morphologie und Bedeutung (klassisches Chinesisch ist in Planung)
CATMA Computer Assisted Textual Markup and Analysis
unterstützt CJK, Arabisch, Hebräisch etc.
Ein webbasiertes Werkzeug, mit dem Korpora untersucht werden können. Es wurde von dem National Institute for Japanese Language and Linguistics (NINJAL) entwickelt. Eine Registrierung ist für die Nutzung erforderlich.
Juxta Commons (online Version)
Werkzeug für Textkritik
Quantitative Inhaltsanalyse und Text-Mining (japanisch)
Topic Modeling, unterstützt Japanisch
Untersützt unter anderem Russisch; auf der Webseite wird angeben, dass viele Sprachen auf Anfrage ergänzt werden können. Beinhaltet eine OCR (Optical Character Recognition) und ein Entity-Plugin.
Stanford CoreNLP – Natural language software
Linguistische Analysetools mit NER (Named Entity Recognition), POS Tagger (Part of Speech), Parser (works out the grammatical structure of sentences), Sentiment Analysis, Pattern-based entity extraction and visualization, Open information extraction (open IE = extraction of relation tuples, typically binary relations, from plain text). Unterstützt Arabisch und Chinesisch, weiter Informationen zu Sprachen in diesem Werkzeug hier.
Kann rtl-Schrift darstellen, aber viele Funktionen wie Lemmatisierung sind für einige Sprachen nicht möglich. Die linguistische Analyse ist auf chinesische Texte ausgelegt.
Textanalyse und Visualisierung für Japanisch
für hieroglyphische Texte
Annotationstools
Open Source Such- und Visualisierungsarchitektur für komplexe, mehrschichtige linguistische Korpora
Annotation von Video- und Audiomaterial.
Umgebung zur linguistischen Annotation basierend auf dem FoLiA-Format
Named-entity recognition (NER), Analyse- und Visualisierungstools für chinesische Texte
GUI basierte Desktop-App
Online-Plattform für kollaboratives Annotieren von Texten, Bildern und Tabellen.
Semantic textual similarity (STS) Annotation.
WebAnno (Clarin-D)
Morphologische Analyse / Tokenizer
Japanisch
Morphologische Analyse von japanischen Texten
Tiny Segmenter (Japanisch, Java Script)
Sonnenblume (ひまわり)
Keyword-in-Context, Suchsystem
Japanisches Lexikon mit Angaben zur Morphologie und integriertem morphologischen Analysewerkzeug MeCab
Chinesisch
Chinese Word Segmentation System
Mehrere Sprachen
Word- und Morphemsegmentierung für Japanisch, Chinesisch „and other languages“
Morphologische Analyse (word segmentor + PoS Tagger) für Chinesisch und Japanisch.
GIS und Geo-Normdateien
iDAI.gazetteer (enthält nicht-lateinische Einträge)
GeoNames (englisch)
GeoNLP (japanisch)
Palladio (auch Netzwerkanalyse)
PLATIN (Analyse und Visualisierung von geospatialen und temporalen Daten)
Netzwerkanalyse
Open Source Software zur Netzwerkanalyse und Visualisierung
Open Source Software zur Netzwerkanalyse und Visualisierung
Open Source Software zur Netzwerkanalyse und Visualisierung
Visualisierung von Karten/Koordinaten und Visualisierung von Netzwerke; Tabellen; Galerie
Transkriptionstools
Japanisch:
Konvertierung von Kanji in Hiragana, Katakana und lateinische Schrift
Koreanisch:
Hangul-Konverter nach McCune-Reischauer
K-Romanizer der OAS Bibliothek der Universität Princeton (McCune-Reischauer)
Korean Romanization Converter eines Prof. der Seoul National University (Prof. Lee, Sang-Oak), entwickelt vom AI-LAB der Pusan-Universität und der Nara Info Tech Co.
Chinesisch:
漢字轉拼音工具 Pinyin <> Kurz- und Langzeichen (nur für Microsoft Windows)
Romax Pinyin <> Wade Giles
Visualisierung
JavaScript-Bibliothek für Datenvisualisierung; (inoffiziell) auch CJK-Sprachen
Zeitangabe/ -analyse/ -visualisierung
Werkzeug um Zeitleisten zu visualisieren
Datenmodelle, 3D-Layouts und Python-Funktionen, um komplexe oder unbestimmte Zeitabschnitte und Ereignisse darzustellen.