org.languagetool.rules.de.GermanSpellerRule.java Source code

Introduction

Here is the source code for org.languagetool.rules.de.GermanSpellerRule.java
Source

/* LanguageTool, a natural language style checker 
 * Copyright (C) 2012 Daniel Naber (http://www.danielnaber.de)
 * 
 * This library is free software; you can redistribute it and/or
 * modify it under the terms of the GNU Lesser General Public
 * License as published by the Free Software Foundation; either
 * version 2.1 of the License, or (at your option) any later version.
 *
 * This library is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
 * Lesser General Public License for more details.
 *
 * You should have received a copy of the GNU Lesser General Public
 * License along with this library; if not, write to the Free Software
 * Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301
 * USA
 */
package org.languagetool.rules.de;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.Reader;
import java.io.SequenceInputStream;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Locale;
import java.util.Map;
import java.util.ResourceBundle;
import java.util.Set;
import java.util.function.Function;
import java.util.regex.Pattern;
import java.util.stream.Collectors;

import org.apache.commons.lang3.RegExUtils;
import org.apache.commons.lang3.StringUtils;
import org.jetbrains.annotations.Nullable;
import org.languagetool.AnalyzedSentence;
import org.languagetool.AnalyzedToken;
import org.languagetool.AnalyzedTokenReadings;
import org.languagetool.JLanguageTool;
import org.languagetool.Language;
import org.languagetool.UserConfig;
import org.languagetool.language.German;
import org.languagetool.languagemodel.LanguageModel;
import org.languagetool.rules.Example;
import org.languagetool.rules.ngrams.Probability;
import org.languagetool.rules.spelling.hunspell.CompoundAwareHunspellRule;
import org.languagetool.rules.spelling.morfologik.MorfologikMultiSpeller;
import org.languagetool.synthesis.Synthesizer;
import org.languagetool.tagging.Tagger;
import org.languagetool.tokenizers.de.GermanCompoundTokenizer;
import org.languagetool.tools.StringTools;

import de.danielnaber.jwordsplitter.GermanWordSplitter;
import de.danielnaber.jwordsplitter.InputTooLongException;

import static java.nio.charset.StandardCharsets.*;

public class GermanSpellerRule extends CompoundAwareHunspellRule {

    public static final String RULE_ID = "GERMAN_SPELLER_RULE";

    private static final int MAX_EDIT_DISTANCE = 2;

    // some exceptions for changes to the spelling in 2017 - just a workaround so we don't have to touch the binary dict:
    private static final Pattern PREVENT_SUGGESTION = Pattern.compile(
            ".*(Majonse|Bravur|Anschovis|Belkanto|Campagne|Frott|Grisli|Jockei|Joga|Kalvinismus|Kanossa|Kargo|Ketschup|"
                    + "Kollier|Kommunikee|Masurka|Negligee|Nessessr|Poulard|Varietee|Wandalismus|kalvinist).*");

    private final Set<String> wordsToBeIgnoredInCompounds = new HashSet<>();
    private final Set<String> wordStartsToBeProhibited = new HashSet<>();
    private final Set<String> wordEndingsToBeProhibited = new HashSet<>();
    private static final Map<Pattern, Function<String, List<String>>> ADDITIONAL_SUGGESTIONS = new HashMap<>();
    static {
        put("abschiednehmen", "Abschied nehmen");
        put("wars", w -> Arrays.asList("war's", "war es"));
        put("[aA]wa", w -> Arrays.asList("AWA", "ach was", "aber"));
        put("[aA]lsallerersten?s", w -> Arrays.asList(w.replaceFirst("lsallerersten?s", "ls allererstes"),
                w.replaceFirst("lsallerersten?s", "ls Allererstes")));
        putRepl("(an|auf|ein|zu)gehangen(e[mnrs]?)?$", "hangen", "hngt");
        putRepl("[oO]key", "ey$", "ay");
        put("packet", "Paket");
        put("Allalei", "Allerlei");
        put("geupdate[dt]$", "upgedatet");
        put("gefaked", "gefakt");
        put("[pP]roblemhaft(e[nmrs]?)?",
                w -> Arrays.asList(w.replaceFirst("haft", "behaftet"), w.replaceFirst("haft", "atisch")));
        put("rosane[mnrs]?$", w -> Arrays.asList("rosa", w.replaceFirst("^rosan", "rosafarben")));
        put("Erbung", w -> Arrays.asList("Vererbung", "Erbschaft"));
        put("Energiesparung", w -> Arrays.asList("Energieeinsparung", "Energieersparnis"));
        put("Abbrechung", "Abbruch");
        put("Abbrechungen", w -> Arrays.asList("Abbrche", "Abbrchen"));
        put("Urteilung", w -> Arrays.asList("Urteil", "Verurteilung"));
        put("allmglichen?", w -> Arrays.asList("alle mglichen", "alle mgliche"));
        put("Krankenhausen", w -> Arrays.asList("Krankenhusern", "Krankenhuser"));
        put("vorr?auss?etzlich", w -> Arrays.asList("voraussichtlich", "vorausgesetzt"));
        put("nichtmals", w -> Arrays.asList("nicht mal", "nicht einmal"));
        put("eingepeilt", "angepeilt");
        put("gekukt", "geguckt");
        put("berhaut", "berhaupt");
        put("nacher", "nachher");
        put("jeztz", "jetzt");
        put("[wW]ah?rscheindlichkeit", "Wahrscheinlichkeit");
        put("Hijab", "Hidsch?b");
        putRepl("for?melar(en?)?", "for?me", "Formu");
        putRepl("nste[mnrs]?$", "^ns", "nchs");
        putRepl("Erdogans?$", "^Erdogan", "Erdoan");
        put("Germanistiker[ns]", "Germanisten");
        putRepl("Germanistikerin(nen)?", "Germanistiker", "Germanist");
        putRepl("[iI]ns?z[ie]nie?rung(en)?", "[iI]ns?z[ie]nie?", "Inszenie");
        putRepl("[eE]rhherung(en)?", "[eE]rhherung", "Erhhung");
        putRepl("[vV]orallendingen", "orallendingen", "or allen Dingen");
        putRepl("[aA]ufjede[nm]fall", "jede[nm]fall$", " jeden Fall");
        putRepl("[aA]us[vf]ersehen[dt]lich", "[vf]ersehen[dt]lich", " Versehen");
        putRepl("^funk?z[ou]nier.+", "funk?z[ou]nier", "funktionier");
        putRepl("[wW]ruber", "ru", "or");
        putRepl("[lL]einensamens?", "[lL]einen", "Lein");
        putRepl("Feinleiner[ns]?", "Feinlei", "Fineli");
        putRepl("[hH]eilei[td]s?", "[hH]eilei[td]", "Highlight");
        putRepl("Oldheimer[ns]?", "he", "t");
        putRepl("[tT]rner[ns]?", "[tT]r", "Trai");
        putRepl("[tT]eimings?", "[tT]e", "T");
        putRepl("unternehmensl[u]stig(e[mnrs]?)?", "mensl[u]st", "mungslust"); // "unternehmenslstig" -> "unternehmungslustig"
        putRepl("proff?ess?ional(e[mnrs]?)?", "ff?ess?ional", "fessionell");
        putRepl("zuverlsslich(e[mnrs]?)?", "lich", "ig");
        putRepl("fluoreszenzierend(e[mnrs]?)?", "zen", "");
        putRepl("revalierend(e[mnrs]?)?", "^reval", "rivalis");
        putRepl("verhuft(e[mnrs]?)?", "^ver", "ge");
        putRepl("strmig(e[mnrs]?)?", "mig", "misch");
        putRepl("greste[mnrs]?", "es", "");
        putRepl("n[a]heste[mnrs]?", "n[a]he", "nch");
        putRepl("gesundlich(e[mnrs]?)?", "lich", "heitlich");
        putRepl("eckel(e|t(en?)?|st)?", "^eck", "ek");
        putRepl("unhervorgesehen(e[mnrs]?)?", "hervor", "vorher");
        putRepl("entt?euscht(e[mnrs]?)?", "entt?eusch", "enttusch");
        putRepl("Phhlen?", "^Ph", "Pf");
        putRepl("Kattermesser[ns]?", "Ka", "Cu");
        putRepl("gehe?rr?t(e[mnrs]?)?", "he?rr?", "ehr"); // "geherte" -> "geehrte"
        putRepl("gehrter?", "^ge", "gee");
        putRepl("[nN]amenhaft(e[mnrs]?)?", "amen", "am");
        putRepl("hom(o?e|)ophatisch(e[mnrs]?)?", "hom(o?e|)ophat", "homopath");
        putRepl("Geschwindlichkeit(en)?", "lich", "ig");
        put("Investion", "Investition");
        put("Pakur", w -> Arrays.asList("Parcours", "Parkuhr"));
        put("Erstsemesterin", w -> Arrays.asList("Erstsemester", "Erstsemesters", "Erstsemesterstudentin"));
        put("Erstsemesterinnen", w -> Arrays.asList("Erstsemester", "Erstsemestern"));
        put("kreativlos(e[nmrs]?)?",
                w -> Arrays.asList(w.replaceFirst("kreativ", "fantasie"), w.replaceFirst("kreativ", "einfalls"),
                        w.replaceFirst("kreativlos", "unkreativ"), w.replaceFirst("kreativlos", "uninspiriert")));
        put("Kreativlosigkeit", "Unkreativitt");
        put("hinund?her", "hin und her");
        put("[lL]ymph?trie?nasche", "Lymphdrainage");
        put("Interdeterminismus", "Indeterminismus");
        put("elektritt", "Elektrizitt");
        put("ausgeboten", "ausgebootet");
        put("nocheinmall", "noch einmal");
        put("aerst", "uerst");
        put("Grrsse", "Gre");
        put("misverstndniss", "Missverstndnis");
        put("warheit", "Wahrheit");
        put("[pP]okemon", "Pokmon");
        put("kreigt", "kriegt");
        put("Fritse", "Fritteuse");
        put("unerkennlich", "unkenntlich");
        put("rckg[e]nglich", "rckgngig");
        put("em?men[sz]", "immens");
        put("verhing", "verhngte");
        put("verhingen", "verhngten");
        put("fangte", "fing");
        put("fangten", "fingen");
        put("schlie[s]te", "schloss");
        put("schlie[s]ten", "schlossen");
        put("past", "passt");
        put("eingetragt", "eingetragen");
        put("getrunkt", "getrunken");
        put("verht", "verrt");
        put("helfte", "half");
        put("helften", "halfen");
        put("befehlte", "befahl");
        put("befehlten", "befahlen");
        put("lgte", "log");
        put("lgten", "logen");
        put("bratete", "briet");
        put("brateten", "brieten");
        put("gefahl", "gefiel");
        put("Komplexibilitt", "Komplexitt");
        put("abbonement", "Abonnement");
        put("perse", "per se");
        put("Schwitch", "Switch");
        put("[aA]nwesenzeiten", "Anwesenheitszeiten");
        put("[gG]eizigkeit", "Geiz");
        put("[fF]leiigkeit", "Flei");
        put("[bB]equemheit", "Bequemlichkeit");
        put("[mM]issionarie?sie?rung", "Missionierung");
        put("[sS]chee?selonge?", "Chaiselongue");
        put("Re[kc]amiere", "Rcamire");
        put("Singel", "Single");
        put("legen[td]lich", "lediglich");
        put("ein[ua]ndhalb", "eineinhalb");
        put("[mM]illion(en)?mal",
                w -> Collections.singletonList(StringTools.uppercaseFirstChar(w.replaceFirst("mal", " Mal"))));
        put("Mysql", "MySQL");
        put("Opelarena", "Opel Arena");
        put("Toll-Collect", "Toll Collect");
        put("[pP][qQ]-Formel", "p-q-Formel");
        put("desweitere?[nm]", "des Weiteren");
        put("handzuhaben", "zu handhaben");
        put("nachvollzuziehe?n", "nachzuvollziehen");
        put("Porto?folien", "Portfolios");
        put("[sS]chwie?ri?chkeiten", "Schwierigkeiten");
        put("[]bergrifflichkeiten", "bergriffigkeiten");
        put("[aA]r?th?rie?th?is", "Arthritis");
        put("zugesand", "zugesandt");
        put("weibt", "weit");
        put("instande?zusetzen", "instand zu setzen");
        put("Lia(si|is)onen", "Liaisons");
        put("[cC]asemana?ge?ment", "Case Management");
        put("[aA]nn?[ou]ll?ie?rung", "Annullierung");
        put("[sS]charm", "Charme");
        put("[zZ]auberlich(e[mnrs]?)?",
                w -> Arrays.asList(w.replaceFirst("lich", "isch"), w.replaceFirst("lich", "haft")));
        putRepl("([uU]n)?proff?esionn?ell?(e[mnrs]?)?", "proff?esionn?ell?", "professionell");
        putRepl("[kK]inderlich(e[mnrs]?)?", "inder", "ind");
        putRepl("[wW]iedersprichs?t", "ieder", "ider");
        putRepl("[wW]iederstand", "ieder", "ider");
        putRepl("[kK]nntes", "es$", "est");
        putRepl("[aA]ssess?oare?s?", "[aA]ssess?oare?", "Accessoire");
        putRepl("indifiziert(e[mnrs]?)?", "ind", "ident");
        putRepl("dreite[mnrs]?", "dreit", "dritt");
        putRepl("verblte[mnrs]?", "bl", "blh");
        putRepl("Einzigste[mnrs]?", "zigst", "zig");
        putRepl("(aller)?einzie?gste[mnrs]?", "(aller)?einzie?gst", "einzig");
        putRepl("[iI]nterkurell(e[nmrs]?)?", "ku", "kultu");
        putRepl("[iI]ntersannt(e[mnrs]?)?", "sannt", "essant");
        putRepl("ubera(g|sch)end(e[nmrs]?)?", "uber", "berr");
        putRepl("[wW]olt$", "lt", "llt");
        putRepl("[zZ]uende", "ue", "u E");
        putRepl("[iI]nblde", "nb", "n B");
        putRepl("[lL]etztenendes", "ene", "en E");
        putRepl("[nN]achwievor", "wievor", " wie vor");
        putRepl("[zZ]umbeispiel", "beispiel", " Beispiel");
        putRepl("[gG]ottseidank", "[gG]ottseidank", "Gott sei Dank");
        putRepl("[gG]rundauf", "[gG]rundauf", "Grund auf");
        putRepl("[aA]nsichtnach", "[aA]nsicht", "Ansicht ");
        putRepl("[uU]nswar", "swar", "d zwar");
        putRepl("[wW]aschte(s?t)?", "aschte", "usch");
        putRepl("[wW]aschten", "ascht", "usch");
        putRepl("Probiren?", "ir", "ier");
        putRepl("[gG]esetztreu(e[nmrs]?)?", "tz", "tzes");
        putRepl("[wW]ikich(e[nmrs]?)?", "k", "rkl");
        putRepl("[uU]naufbesichtigt(e[nmrs]?)?", "aufbe", "beauf");
        putRepl("[nN]utzvoll(e[nmrs]?)?", "utzvoll", "tzlich");
        putRepl("Lezte[mnrs]?", "Lez", "Letz");
        putRepl("Letze[mnrs]?", "Letz", "Letzt");
        putRepl("[nN]i[vw]os?", "[nN]i[vw]o", "Niveau");
        putRepl("[dD]illetant(en)?", "[dD]ille", "Dilet");
        putRepl("Makeups?", "up", "-up");
        putRepl("Frauenhofer-(Institut|Gesellschaft)", "Frauen", "Fraun");
        putRepl("Add-?Ons?", "Add-?On", "Add-on");
        putRepl("Addons?", "on", "-on");
        putRepl("Internetkaffees?", "kaffee", "caf");
        putRepl("[gG]ehorsamkeitsverweigerung(en)?", "[gG]ehorsamkeit", "Gehorsam");
        putRepl("[wW]ochende[ns]?", "[wW]ochend", "Wochenend");
        putRepl("[kK]ongratulier(en?|t(en?)?|st)", "[kK]on", "");
        putRepl("[wWkKdD]an$", "n$", "nn");
        putRepl("geh?neh?m[ie]gung(en)?", "geh?neh?m[ie]gung", "Genehmigung");
        putRepl("Korrigierung(en)?", "igierung", "ektur");
        putRepl("[kK]orregierung(en)?", "[kK]orregierung", "Korrektur");
        putRepl("[kK]orrie?girung(en)?", "[kK]orrie?girung", "Korrektur");
        putRepl("[nN]ocheimal", "eimal", " einmal");
        putRepl("[aA]benzu", "enzu", " und zu");
        putRepl("[kK]onflikation(en)?", "[kK]onfli", "Kompli");
        putRepl("[mM]itanader", "ana", "einan");
        putRepl("[mM]itenand", "enand", "einander");
        putRepl("Gelangenheitsbesttigung(en)?", "heit", "");
        putRepl("[jJ]edwillige[mnrs]?", "willig", "wed");
        putRepl("[qQ]ualitts?bewut(e[mnrs]?)?", "ts?bewut", "tsbewusst");
        putRepl("[vV]oraussichtig(e[nmrs]?)?", "sichtig", "sichtlich");
        putRepl("[gG]leichrechtig(e[nmrs]?)?", "rechtig", "berechtigt");
        putRepl("[uU]nntzlich(e[nmrs]?)?", "ntzlich", "ntz");
        putRepl("[uU]nzerbrechbar(e[nmrs]?)?", "bar", "lich");
        putRepl("kolegen?", "ko", "Kol");
        putRepl("tableten?", "tablet", "Tablett");
        putRepl("verswinde(n|s?t)", "^vers", "versch");
        putRepl("unverantwortungsvoll(e[nmrs]?)?", "unverantwortungsvoll", "verantwortungslos");
        putRepl("[gG]erechtlichkeit", "[gG]erechtlich", "Gerechtig");
        putRepl("[zZ]uverlsslichkeit", "lich", "ig");
        putRepl("[uU]nverzeilig(e[mnrs]?)?", "zeilig", "zeihlich");
        putRepl("[zZ]uk(ue?|)nftlich(e[mnrs]?)?", "uk(ue?|)nftlich", "uknftig");
        putRepl("[rR]eligisisch(e[nmrs]?)?", "isch", "");
        putRepl("[fF]olklorisch(e[nmrs]?)?", "isch", "istisch");
        putRepl("[eE]infhlsvoll(e[nmrs]?)?", "voll", "am");
        putRepl("Unstimmlichkeit(en)?", "lich", "ig");
        putRepl("Strebergartens?", "Stre", "Schre");
        putRepl("[hH]hern(e[mnrs]?)?", "hern", "ren");
        putRepl("todesbedroh(end|lich)(e[nmrs]?)?", "todes", "lebens");
        putRepl("^[uU]nabsichtig(e[nmrs]?)?", "ig", "lich");
        putRepl("[aA]ntisemitistisch(e[mnrs]?)?", "tist", "t");
        putRepl("[uU]nvorsehbar(e[mnrs]?)?", "vor", "vorher");
        putRepl("([eE]r|[bB]e|unter|[aA]uf)?hlst", "hlst", "hltst");
        put("[wW]ohlfhlseins?", w -> Arrays.asList("Wellness", w.replaceFirst("[wW]ohlfhlsein", "Wohlbefinden"),
                w.replaceFirst("[wW]ohlfhlsein", "Wohlfhlen")));
        putRepl("[sS]chmett?e?rling(s|en?)?", "[sS]chmett?e?rling", "Schmetterling");
        putRepl("^[eE]inlamie?nie?r(st|en?|(t(e[nmrs]?)?))?", "^einlamie?nie?r", "laminier");
        putRepl("[bB]ravurs(e[nrms]?)?", "vur", "vour");
        putRepl("[aA]ss?ecoires?", "[aA]ss?ec", "Access");
        putRepl("[aA]ufwechse?lungsreich(er|st)?(e[nmrs]?)?", "ufwechse?lung", "bwechslung");
        putRepl("[iI]nordnung", "ordnung", " Ordnung");
        putRepl("[iI]mmoment", "moment", " Moment");
        putRepl("[hH]euteabend", "abend", " Abend");
        putRepl("[wW]ienerschnitzel[ns]?", "[wW]ieners", "Wiener S");
        putRepl("[sS]chwarzwlderkirschtorten?", "[sS]chwarzwlderk", "Schwarzwlder K");
        putRepl("[kK]oxial(e[nmrs]?)?", "x", "ax");
        putRepl("([]ber|[uU]unter)durs?chnitt?lich(e[nmrs]?)?", "s?chnitt?", "chschnitt");
        putRepl("[dD]urs?chnitt?lich(e[nmrs]?)?", "s?chnitt?", "chschnitt");
        putRepl("[dD]urs?chnitts?", "s?chnitt", "chschnitt");
        putRepl("[sS]triktlich(e[mnrs]?)?", "lich", "");
        putRepl("[hH]chstwahrlich(e[mnrs]?)?", "wahr", "wahrschein");
        putRepl("[oO]rganisativ(e[nmrs]?)?", "tiv", "torisch");
        putRepl("[kK]ontaktfreundlich(e[nmrs]?)?", "ndlich", "dig");
        putRepl("Helfer?s-Helfer[ns]?", "Helfer?s-H", "Helfersh");
        putRepl("[iI]ntell?igentsbestien?", "[iI]ntell?igents", "Intelligenz");
        putRepl("[aA]vantgardisch(e[mnrs]?)?", "gard", "gardist");
        putRepl("[gG]ewohnheitsbedrftig(e[mnrs]?)?", "wohnheit", "whnung");
        putRepl("[eE]infhlungsvoll(e[mnrs]?)?", "fhlungsvoll", "fhlsam");
        putRepl("[vV]erwant(e[mnrs]?)?", "want", "wandt");
        putRepl("[aAeE]rtzten?", "[aAeE]rt", "r");
        putRepl("pdf-Datei(en)?", "pdf", "PDF");
        putRepl("rumnern?", "rumner", "Rumne");
        putRepl("[cCKk]o?usengs?", "[cCKk]o?useng", "Cousin");
        putRepl("Influenzer(in(nen)?|[ns])?", "zer", "cer");
        putRepl("[vV]ersantdienstleister[ns]?", "[vV]ersant", "Versand");
        putRepl("[pP]atrolier(s?t|t?en?)", "atrolier", "atrouillier");
        putRepl("[pP]ropagandiert(e[mnrs]?)?", "and", "");
        putRepl("[pP]ropagandier(en|st)", "and", "");
        putRepl("[kK]app?erzitt(en)?", "^[kK]app?er", "Kapa");
        putRepl("knzel(n|s?t)", "knzel", "cancel");
        put("geknzelt", "gecancelt");
        put("mogen", "morgen");
        put("[rR]ev", "Revue");
        put("eingnglich", "eingangs");
        put("geerthe", "geehrte");
        put("interrese", "Interesse");
        put("[rR]eschrschen", "Recherchen");
        put("[rR]eschrsche", "Recherche");
        put("ic", "ich");
        put("w[e]hret", "wret");
        put("mahte", "Mathe");
        put("letzdenendes", "letzten Endes");
        put("aufgesteht", "aufgestanden");
        put("ganichts", "gar nichts");
        put("gesich", "Gesicht");
        put("glass", "Glas");
        put("muter", "Mutter");
        put("[pP]appa", "Papa");
        put("dier", "dir");
        put("Referenz-Nr", "Referenz-Nr.");
        put("Matrikelnr.", "Matrikel-Nr.");
        put("Rekrutings?prozess", "Recruitingprozess");
        put("sumarum", "summarum");
        put("nderen", w -> Arrays.asList("ndern", "anderen"));
        put("wanderen", w -> Arrays.asList("wandern", "Wanderern"));
        put("Dutzen", w -> Arrays.asList("Duzen", "Dutzend"));
        put("patien", w -> Arrays.asList("Partien", "Patient"));
        put("Teammitgliederinnen", w -> Arrays.asList("Teammitgliedern", "Teammitglieder"));
        put("beidige[mnrs]?",
                w -> Arrays.asList(w.replaceFirst("ig", ""), w.replaceFirst("beid", "beiderseit"), "beeidigen")); //beide, beiderseitige, beeidigen
        put("Wissbegierigkeit", w -> Arrays.asList("Wissbegier", "Wissbegierde"));
        put("Nabend", "'n Abend");
        put("gie?bts", "gibt's");
        put("vs", "vs.");
        put("[kK]affeeteria", "Cafeteria");
        put("[kK]affeeterien", "Cafeterien");
        put("bercksicht", "bercksichtigt");
        put("nix", "nichts");
        put("must", "musst");
        put("kaffe", "Kaffee");
        put("zetel", "Zettel");
        put("wie?daholung", "Wiederholung");
        put("vie?d(er|a)sehen", "wiedersehen");
        put("pr[e]ventiert", "verhindert");
        put("pr[e]ventieren", "verhindern");
        put("zur?verfgung", "zur Verfgung");
        put("Verwahrlosigkeit", "Verwahrlosung");
        put("[oO]r?ganisazion", "Organisation");
        put("[oO]rganisative", "Organisation");
        put("Emall?iearbeit", "Emaillearbeit");
        put("[aA]petitt", "Appetit");
        put("bezuggenommen", "Bezug genommen");
        put("mgt", "mgt");
        put("frug", "fragte");
        put("gesht", "gest");
        put("verennt", "verrennt");
        put("berrant", "berrannt");
        put("Gallop", "Galopp");
        put("Stop", "Stopp");
        put("Schertz", "Scherz");
        put("dreiundhalb", "dreieinhalb");
        put("geschied", "geschieht");
        put("Aku", "Akku");
        put("Migrationspackt", "Migrationspakt");
        put("[zZ]ulaufror", "Zulaufrohr");
        put("[gG]ebrauchss?puhren", "Gebrauchsspuren");
        put("[pP]reisnachlassung", "Preisnachlass");
        put("[mM]edikamentation", "Medikation");
        put("[nN][ei]gliche", "Neglig");
        put("palletten?", w -> Arrays.asList(w.replaceFirst("pall", "Pal"), w.replaceFirst("pa", "Pai")));
        put("Geruch", w -> Arrays.asList("Gerusch", "Gestruch"));
        put("[sS]chull?igung", "Entschuldigung");
        put("Geerte", "geehrte");
        put("versichen", "versichern");
        put("hobb?ies", "Hobbys");
        put("Begierigkeiten", "Begehrlichkeiten");
        put("selblosigkeit", "Selbstlosigkeit");
        put("gestyled", "gestylt");
        put("umstimigkeiten", "Unstimmigkeiten");
        put("unann?h?ml?ichkeiten", "Unannehmlichkeiten");
        put("unn?ann?ehmichkeiten", "Unannehmlichkeiten");
        put("bertr[a]gte", "bertrug");
        put("bertr[a]gten", "bertrugen");
        putRepl("bertrgt(e[mnrs]?)?", "^bertrgt", "bertragen");
        putRepl("[iI]nterresent(e[mnrs]?)?", "rresent", "ressant");
        putRepl("Simkartenleser[ns]?", "^Simkartenl", "SIM-Karten-L");
        putRepl("Hilfstmittel[ns]?", "^Hilfst", "Hilfs");
        putRepl("trationell(e[mnrs]?)?", "^tra", "tradi");
        putRepl("[bB]erreichs?", "^[bB]er", "Be");
        putRepl("[fF]uscher[ns]?", "^[fF]u", "Pfu");
        putRepl("[uU]nausweichbar(e[mnrs]?)?", "bar", "lich");
        putRepl("[uU]nabdinglich(e[mnrs]?)?", "lich", "bar");
        putRepl("[eE]ingnglich(e[mnrs]?)?", "lich", "ig");
        putRepl("ausgewh?nlich(e[mnrs]?)?", "^ausgewh?n", "auergewhn");
        putRepl("achsial(e[mnrs]?)?", "^achs", "ax");
        putRepl("famielen?", "^famiel", "Famili");
        putRepl("miter[ns]?", "^mi", "Mie");
        putRepl("besig(t(e[mnrs]?)?|en?)", "sig", "sieg");
        putRepl("[vV]erziehr(t(e[mnrs]?)?|en?)", "ieh", "ie");
        putRepl("^[pP]iek(s?t|en?)", "iek", "ik");
        putRepl("[mM]atschscheiben?", "[mM]atschsch", "Mattsch");
        put("schafen?", w -> Arrays.asList(w.replaceFirst("sch", "schl"), w.replaceFirst("af", "arf"),
                w.replaceFirst("af", "aff")));
        put("zuschafen", "zu schaffen");
        putRepl("[hH]ofen?", "of", "off");
        putRepl("[sS]ommerverien?", "[sS]ommerverien?", "Sommerferien");
        putRepl("[rR]ecourcen?", "[rR]ec", "Ress");
        putRepl("[fF]amm?ill?i?[a]risch(e[mnrs]?)?", "amm?ill?i?[a]risch", "amilir");
        putRepl("Sim-Karten?", "^Sim", "SIM");
        putRepl("Spax-Schrauben?", "^Spax", "SPAX");
        putRepl("[aA]leine", "l", "ll");
        putRepl("Kaput", "t", "tt");
        putRepl("[fF]estell(s?t|en?)", "est", "estst");
        putRepl("(Baden-)?Wrtenbergs?", "Wrten", "Wrttem");
        putRepl("Betriebsratzimmer[ns]?", "rat", "rats");
        putRepl("Rechts?schreibungsfehler[ns]?", "Rechts?schreibungs", "Rechtschreib");
        putRepl("Open[aA]ir-Konzert(en?)?", "Open[aA]ir", "Open-Air");
        putRepl("Jugenschuhen?", "Jug", "Jung");
        putRepl("TODO-Listen?", "TODO", "To-do");
        putRepl("ausiehs?t", "aus", "auss");
        putRepl("unterbemittel(nd|t)(e[nmrs]?)?", "unterbemittel(nd|t)", "minderbemittelt");
        putRepl("[xX]te[mnrs]?", "te", "-te");
        putRepl("verheielt(e[mnrs]?)?", "heiel", "heil");
        putRepl("[rR]evolutionie?sier(s?t|en?)", "ie?s", "");
        putRepl("Kohleaustiegs?", "aus", "auss");
        putRepl("[jJ]urististisch(e[mnrs]?)?", "istist", "ist");
        putRepl("gehckelt(e[nmrs]?)?", "ck", "k");
        putRepl("deutsprachig(e[nmrs]?)?", "deut", "deutsch");
        putRepl("angesehend(st)?e[nmrs]?", "end", "en");
        putRepl("[iI]slamophobisch(e[mnrs]?)?", "isch", "");
        putRepl("[vV]erharkt(e[mnrs]?)?", "ar", "a");
        putRepl("[dD]esfterer?[nm]", "fterer?[nm]", " fteren");
        putRepl("[dD]eswei[dt]ere?[mn]", "wei[dt]ere?[mn]", " Weiteren");
        putRepl("Einkaufstachen?", "ch", "sch");
        putRepl("Bortmesser[ns]?", "Bor", "Bro");
        putRepl("Makeupstylist(in(nen)?|en)?", "Makeups", "Make-up-S");
        putRepl("Fee?dbcks?", "Fee?dbck", "Feedback");
        putRepl("weirete[nmrs]?", "ret", "ter");
        putRepl("Ni[vw]oschalter[ns]?", "Ni[vw]o", "Niveau");
        putRepl("[eE]xhibitionisch(e[nmrs]?)?", "isch", "istisch");
        putRepl("(ein|aus)?[gG]eschalten(e[nmrs]?)?", "ten", "tet");
        putRepl("[uU]nterschiebene[nmrs]?", "sch", "schr");
        putRepl("[uU]nbequemlich(st)?e[nmrs]?", "lich", "");
        putRepl("[uU][nm]bekweh?m(e[nmrs]?)?", "[nm]bekweh?m", "nbequem");
        putRepl("[dD]esatr(s|en?)?", "satr", "serteur");
        put("Panelen?", w -> Arrays.asList(w.replaceFirst("Panel", "Paneel"), "Panels"));
        put("D[e]ja-?[vV]o?ue?", "Dj-vu");
        put("Cr[e]me-?fra[i]che", "Crme frache");
        put("[aA]rr?an?gemont", "Arrangement");
        put("Phyrr?ussieg", "Pyrrhussieg");
        put("Mio", "Mio.");
        put("Datein", "Dateien");
        put("[pP]u(zz|ss)el", "Puzzle");
        put("Smilies", "Smileys");
        put("[dD]iseing?", "Design");
        put("[lL]ieradd?ress?e", "Lieferadresse");
        put("[bB]o[yi]kutierung", "Boykottierung");
        put("Mouseclick", "Mausklick");
        put("[aA]ktuelli?esie?rung", "Aktualisierung");
        put("Hndy", "Handy");
        put("gewertschtzt", "wertgeschtzt");
        put("tieger", "Tiger");
        put("Rollade", w -> Arrays.asList("Rollladen", "Roulade"));
        put("garnichtmehr", "gar nicht mehr");
        put("vileich", "vielleicht");
        put("vll?t", "vielleicht");
        put("aufgewgt", "aufgewogen");
        put("[rR]eflektion", "Reflexion");
        put("momentmal", "Moment mal");
        put("satzt", "Satz");
        put("Bff?(ee|)", w -> Arrays.asList("Buffet", "Bfett"));
        put("[fF]rhstcksb[u]ff?(|ee)", "Frhstcksbuffet");
        put("[aA]lterego", "Alter Ego");
        put("Copyride", "Copyright");
        put("Analysierung", "Analyse");
        put("Exel", "Excel");
        put("Glcklichkeit", "Glck");
        put("Begierigkeit", "Begierde");
        put("voralem", "vor allem");
        put("Unorganisation", w -> Arrays.asList("Desorganisation", "Unorganisiertheit"));
        put("Cand(el|le)lightdinner", "Candle-Light-Dinner");
        put("wertgelegt", "Wert gelegt");
        put("Deluxe", "de luxe");
        put("antuhen", "antun");
        put("komen", "kommen");
        put("genien", "genieen");
        put("Stationskrankenpflegerin", "Stationsschwester");
        put("[iIuU]b[ea]w[ae]isung", "berweisung");
        put("[bB]oxhorn", "Bockshorn");
        put("[zZ]oolophie", "Zoophilie");
        put("Makieren", "Markieren");
        put("Altersheimer", "Alzheimer");
        put("gesen", "gesehen");
        put("Neugierigkeit", w -> Arrays.asList("Neugier", "Neugierde"));
        put("[kK]onn?ekt?schen", "Connection");
        put("E-Maul", "E-Mail");
        put("E-Mauls", "E-Mails");
        put("E-Mal", "E-Mail");
        put("E-Mals", "E-Mails");
        put("[nN]ah?richt", "Nachricht");
        put("[nN]ah?richten", "Nachrichten");
        put("Getrixe", "Getrickse");
        put("Ausage", "Aussage");
        put("gelessen", "gelesen");
        put("Kanst", "Kannst");
        put("Unwohlbefinden", "Unwohlsein");
        put("leiwagen", "Leihwagen");
        put("krahn", "Kran");
        put("[hH]ifi", "Hi-Fi");
        put("chouch", "Couch");
        put("eh?rgeit?z", "Ehrgeiz");
        put("solltes", "solltest");
        put("geklabt", "geklappt");
        put("angefangt", "angefangen");
        put("beinhlt", "beinhaltet");
        put("beinhielt", "beinhaltete");
        put("beinhielten", "beinhalteten");
        put("einhaltest", "einhltst");
        put("angeruft", "angerufen");
        put("erhaltete", "erhielt");
        put("bersht", "berst");
        put("staats?angehoe?rigkeit", "Staatsangehrigkeit");
        put("[uU]nangeneh?mheiten", "Unannehmlichkeiten");
        put("Humuspaste", "Hummuspaste");
        put("afarung", "Erfahrung");
        put("bescheid?t", "Bescheid");
        put("[mM]iteillung", "Mitteilung");
        put("Revisionierung", "Revision");
        put("[eE]infhlvermgen", "Einfhlungsvermgen");
        put("[sS]peziellisierung", "Spezialisierung");
        put("[cC]hangse", "Chance");
        put("untergangen", "untergegangen");
        put("geliegt", "gelegen");
        put("BluRay", "Blu-ray");
        put("Freiwilligerin", "Freiwillige");
        put("Mitgliederinnen", w -> Arrays.asList("Mitglieder", "Mitgliedern"));
        put("Hautreinheiten", "Hautunreinheiten");
        put("Durfh?rung", "Durchfhrung");
        put("tuhen", "tun");
        put("tuhe", "tue");
        put("tip", "Tipp");
        put("ccm", "cm");
        put("Kilimand?jaro", "Kilimandscharo");
        put("[hH]erausfor?dung", "Herausforderung");
        put("[bB]ercksichtung", "Bercksichtigung");
        put("artzt?", "Arzt");
        put("[tT]h?elepath?ie", "Telepathie");
        put("Wi-?Fi-Dire[ck]t", "Wi-Fi Direct");
        put("gans", "ganz");
        put("Pearl-Harbou?r", "Pearl Harbor");
        put("[aA]utonomitt", "Autonomie");
        put("[fF]r[u]h?st[u]c?k", "Frhstck");
        putRepl("(ge)?fr[u]h?st[u](c?k|g)t", "fr[u]h?st[u](c?k|g)t", "frhstckt");
        put("zucc?h?inis?", "Zucchini");
        put("[mM]itag", "Mittag");
        put("Lexion", "Lexikon");
        put("[mM]otorisation", "Motorisierung");
        put("[fF]ormalisation", "Formalisierung");
        put("ausprache", "Aussprache");
        put("[mM]enegment", "Management");
        put("[gG]ebrauspuren", "Gebrauchsspuren");
        put("viedeo", "Video");
        put("[hH]erstammung", "Abstammung");
        put("[iI]nstall?atr", "Installateur");
        put("maletriert", "maltrtiert");
        put("abgeschaffen", "abgeschafft");
        put("Verschiden", "Verschieden");
        put("Anschovis", "Anchovis");
        put("Bravur", "Bravour");
        put("Grisli", "Grizzly");
        put("Grislibr", "Grizzlybr");
        put("Grislibren", "Grizzlybren");
        put("Frott", "Frottee");
        put("Joga", "Yoga");
        put("Kalvinismus", "Calvinismus");
        put("Kollier", "Collier");
        put("Kolliers", "Colliers");
        put("Ketschup", "Ketchup");
        put("Kommunikee", "Kommuniqu");
        put("Negligee", "Neglig");
        put("Nessessr", "Necessaire");
        put("passee", "pass");
        put("Varietee", "Variet");
        put("Varietees", "Variets");
        put("Wandalismus", "Vandalismus");
        put("Campagne", "Kampagne");
        put("Campagnen", "Kampagnen");
        put("Jockei", "Jockey");
        put("Roulett", "Roulette");
        put("Bestellungsdaten", "Bestelldaten");
        put("Mo-Di", "Mo.Di.");
        put("Mo-Mi", "Mo.Mi.");
        put("Mo-Do", "Mo.Do.");
        put("Mo-Fr", "Mo.Fr.");
        put("Mo-Sa", "Mo.Sa.");
        put("Mo-So", "Mo.So.");
        put("Di-Mi", "Di.Mi.");
        put("Di-Do", "Di.Do.");
        put("Di-Fr", "Di.Fr.");
        put("Di-Sa", "Di.Sa.");
        put("Di-So", "Di.So.");
        put("Mi-Do", "Mi.Do.");
        put("Mi-Fr", "Mi.Fr.");
        put("Mi-Sa", "Mi.Sa.");
        put("Mi-So", "Mi.So.");
        put("Do-Fr", "Do.Fr.");
        put("Do-Sa", "Do.Sa.");
        put("Do-So", "Do.So.");
        put("Fr-Sa", "Fr.Sa.");
        put("Fr-So", "Fr.So.");
        put("Sa-So", "Sa.So.");
        put("E-mail", "E-Mail");
        putRepl("Saudiarabiens?", "Saudiarabien", "Saudi-Arabien");
        putRepl("eMail-Adressen?", "eMail-", "E-Mail-");
        putRepl("[hH]ats", "ats", "at es");
        putRepl("[Ww]ieviele?", "ieviel", "ie viel");
        put("As", "Ass");
        put("[bB]i[s](s?[ij]|ch)en", "bisschen");
    }

    private static void putRepl(String wordPattern, String pattern, String replacement) {
        ADDITIONAL_SUGGESTIONS.put(Pattern.compile(wordPattern),
                w -> Collections.singletonList(w.replaceFirst(pattern, replacement)));
    }

    private static void put(String pattern, String replacement) {
        ADDITIONAL_SUGGESTIONS.put(Pattern.compile(pattern), w -> Collections.singletonList(replacement));
    }

    private static void put(String pattern, Function<String, List<String>> f) {
        ADDITIONAL_SUGGESTIONS.put(Pattern.compile(pattern), f);
    }

    private static final GermanWordSplitter splitter = getSplitter();

    private static GermanWordSplitter getSplitter() {
        try {
            return new GermanWordSplitter(false);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

    private final LineExpander lineExpander = new LineExpander();
    private final GermanCompoundTokenizer compoundTokenizer;
    private final Synthesizer synthesizer;
    private final Tagger tagger;

    public GermanSpellerRule(ResourceBundle messages, German language) {
        this(messages, language, null, null);
    }

    /**
     * @since 4.2
     */
    public GermanSpellerRule(ResourceBundle messages, German language, UserConfig userConfig,
            String languageVariantPlainTextDict) {
        this(messages, language, userConfig, languageVariantPlainTextDict, Collections.emptyList(), null);
    }

    /**
     * @since 4.3
     */
    public GermanSpellerRule(ResourceBundle messages, German language, UserConfig userConfig,
            String languageVariantPlainTextDict, List<Language> altLanguages, LanguageModel languageModel) {
        super(messages, language, language.getNonStrictCompoundSplitter(),
                getSpeller(language, userConfig, languageVariantPlainTextDict), userConfig, altLanguages,
                languageModel);

        addExamplePair(
                Example.wrong("LanguageTool kann mehr als eine <marker>nromale</marker> Rechtschreibprfung."),
                Example.fixed("LanguageTool kann mehr als eine <marker>normale</marker> Rechtschreibprfung."));
        compoundTokenizer = language.getStrictCompoundTokenizer();
        tagger = language.getTagger();
        synthesizer = language.getSynthesizer();
    }

    @Override
    protected void init() throws IOException {
        super.init();
        super.ignoreWordsWithLength = 1;
        String pattern = "(" + nonWordPattern.pattern() + "|(?<=[\\d])-|-(?=\\d+))";
        nonWordPattern = Pattern.compile(pattern);
        needsInit = false;
    }

    @Override
    public String getId() {
        return RULE_ID;
    }

    @Override
    public List<String> getCandidates(String word) {
        List<List<String>> partList;
        try {
            partList = splitter.getAllSplits(word);
        } catch (InputTooLongException e) {
            partList = new ArrayList<>();
        }
        List<String> candidates = new ArrayList<>();
        for (List<String> parts : partList) {
            candidates.addAll(super.getCandidates(parts));
            if (parts.size() == 2) {
                // e.g. "inneremedizin" -> "innere Medizin"
                candidates.add(parts.get(0) + " " + StringTools.uppercaseFirstChar(parts.get(1)));
            }
            if (parts.size() == 2 && !parts.get(0).endsWith("s")) {
                // so we get e.g. Einzahlungschein -> Einzahlungsschein
                candidates.add(parts.get(0) + "s" + parts.get(1));
            }
            if (parts.size() == 2 && parts.get(1).startsWith("s")) {
                // so we get e.g. Ordnungshtter -> Ordnungshter (Ordnungshtter is split as Ordnung + shtter)
                String firstPart = parts.get(0);
                String secondPart = parts.get(1);
                candidates.addAll(super.getCandidates(Arrays.asList(firstPart + "s", secondPart.substring(1))));
            }
        }
        return candidates;
    }

    @Override
    protected boolean isProhibited(String word) {
        return super.isProhibited(word) || wordStartsToBeProhibited.stream().anyMatch(w -> word.startsWith(w))
                || wordEndingsToBeProhibited.stream().anyMatch(w -> word.endsWith(w));
    }

    @Override
    protected void addIgnoreWords(String origLine) {
        // hack: Swiss German doesn't use "" but always "ss" - replace this, otherwise
        // misspellings (from Swiss point-of-view) like "uere" wouldn't be found:
        String line = language.getShortCodeWithCountryAndVariant().equals("de-CH") ? origLine.replace("", "ss")
                : origLine;
        if (origLine.endsWith("-*")) {
            // words whose line ends with "-*" are only allowed in hyphenated compounds
            wordsToBeIgnoredInCompounds.add(line.substring(0, line.length() - 2));
            return;
        }
        List<String> words = expandLine(line);
        for (String word : words) {
            super.addIgnoreWords(word);
        }
    }

    @Override
    protected List<String> expandLine(String line) {
        return lineExpander.expandLine(line);
    }

    /*
     * @since 3.6
     */
    @Override
    public List<String> getSuggestions(String word) throws IOException {
        List<String> suggestions = super.getSuggestions(word);
        suggestions = suggestions.stream()
                .filter(k -> !PREVENT_SUGGESTION.matcher(k).matches() && !k.endsWith("roulett"))
                .collect(Collectors.toList());
        if (word.endsWith(".")) {
            // To avoid losing the "." of "word" if it is at the end of a sentence.
            suggestions.replaceAll(s -> s.endsWith(".") ? s : s + ".");
        }
        suggestions = suggestions.stream().filter(k -> !k.equals(word)).collect(Collectors.toList());
        return suggestions;
    }

    @Nullable
    private static MorfologikMultiSpeller getSpeller(Language language, UserConfig userConfig,
            String languageVariantPlainTextDict) {
        if (!language.getShortCode().equals(Locale.GERMAN.getLanguage())) {
            throw new IllegalArgumentException("Language is not a variant of German: " + language);
        }
        try {
            String morfoFile = "/de/hunspell/de_" + language.getCountries()[0] + ".dict";
            if (JLanguageTool.getDataBroker().resourceExists(morfoFile)) {
                // spell data will not exist in LibreOffice/OpenOffice context
                List<String> paths = Arrays.asList("/de/hunspell/spelling.txt");
                StringBuilder concatPaths = new StringBuilder();
                List<InputStream> streams = new ArrayList<>();
                for (String path : paths) {
                    concatPaths.append(path).append(";");
                    streams.add(JLanguageTool.getDataBroker().getFromResourceDirAsStream(path));
                }
                try (BufferedReader br = new BufferedReader(
                        new InputStreamReader(new SequenceInputStream(Collections.enumeration(streams)), UTF_8))) {
                    BufferedReader variantReader = null;
                    if (languageVariantPlainTextDict != null && !languageVariantPlainTextDict.isEmpty()) {
                        InputStream variantStream = JLanguageTool.getDataBroker()
                                .getFromResourceDirAsStream(languageVariantPlainTextDict);
                        variantReader = new ExpandingReader(
                                new BufferedReader(new InputStreamReader(variantStream, UTF_8)));
                    }
                    return new MorfologikMultiSpeller(morfoFile, new ExpandingReader(br), concatPaths.toString(),
                            variantReader, languageVariantPlainTextDict,
                            userConfig != null ? userConfig.getAcceptedWords() : Collections.emptyList(),
                            MAX_EDIT_DISTANCE);
                }
            } else {
                return null;
            }
        } catch (IOException e) {
            throw new RuntimeException("Could not set up morfologik spell checker", e);
        }
    }

    @Override
    protected void filterForLanguage(List<String> suggestions) {
        if (language.getShortCodeWithCountryAndVariant().equals("de-CH")) {
            for (int i = 0; i < suggestions.size(); i++) {
                String s = suggestions.get(i);
                suggestions.set(i, s.replace("", "ss"));
            }
        }
        // Remove suggestions like "Mafiosi s" and "Mafiosi s.":
        suggestions.removeIf(s -> Arrays.stream(s.split(" ")).anyMatch(k -> k.matches("\\w\\p{Punct}?")));
        // This is not quite correct as it might remove valid suggestions that start with "-",
        // but without this we get too many strange suggestions that start with "-" for no apparent reason
        // (e.g. for "Gratifikationskrisem" -> "-Gratifikationskrisen"):
        suggestions.removeIf(s -> s.length() > 1 && s.startsWith("-"));
    }

    @Override
    protected List<String> sortSuggestionByQuality(String misspelling, List<String> suggestions) {
        List<String> result = new ArrayList<>();
        List<String> topSuggestions = new ArrayList<>(); // candidates from suggestions that get boosted to the top

        for (String suggestion : suggestions) {
            if (misspelling.equalsIgnoreCase(suggestion)) { // this should be preferred - only case differs
                topSuggestions.add(suggestion);
            } else if (suggestion.contains(" ")) { // this should be preferred - prefer e.g. "vor allem":
                // suggestions at the sentence end include a period sometimes, clean up for ngram lookup
                String[] words = suggestion.replaceFirst("\\.$", "").split(" ", 2);
                if (languageModel != null && words.length == 2) {
                    // language model available, test if split word occurs at all / more frequently than alternative
                    Probability nonSplit = languageModel
                            .getPseudoProbability(Collections.singletonList(words[0] + words[1]));
                    Probability split = languageModel.getPseudoProbability(Arrays.asList(words));
                    //System.out.printf("Probability - %s vs %s: %.12f (%d) vs %.12f (%d)%n",
                    //  words[0] + words[1], suggestion,
                    if (nonSplit.getProb() > split.getProb() || split.getProb() == 0) {
                        result.add(suggestion);
                    } else {
                        topSuggestions.add(suggestion);
                    }
                } else {
                    topSuggestions.add(suggestion);
                }
            } else {
                result.add(suggestion);
            }
        }
        result.addAll(0, topSuggestions);

        return result;
    }

    private boolean ignoreElative(String word) {
        if (StringUtils.startsWithAny(word, "bitter", "dunkel", "erz", "extra", "frh", "gemein", "hyper", "lau",
                "mega", "minder", "stock", "super", "tod", "ultra", "ur")) {
            String lastPart = RegExUtils.removePattern(word,
                    "^(bitter|dunkel|erz|extra|frh|gemein|grund|hyper|lau|mega|minder|stock|super|tod|ultra|ur|voll)");
            return !isMisspelled(lastPart);
        }
        return false;
    }

    @Override
    protected boolean ignoreWord(List<String> words, int idx) throws IOException {
        boolean ignore = super.ignoreWord(words, idx);
        boolean ignoreUncapitalizedWord = !ignore && idx == 0
                && super.ignoreWord(StringUtils.uncapitalize(words.get(0)));
        boolean ignoreByHyphen = false;
        boolean ignoreHyphenatedCompound = false;
        if (!ignore && !ignoreUncapitalizedWord) {
            if (words.get(idx).contains("-")) {
                ignoreByHyphen = words.get(idx).endsWith("-") && ignoreByHangingHyphen(words, idx);
            }
            ignoreHyphenatedCompound = !ignoreByHyphen && ignoreCompoundWithIgnoredWord(words.get(idx));
        }
        return ignore || ignoreUncapitalizedWord || ignoreByHyphen || ignoreHyphenatedCompound
                || ignoreElative(words.get(0));
    }

    @Override
    protected List<String> getAdditionalTopSuggestions(List<String> suggestions, String word) throws IOException {
        String suggestion;
        if ("WIFI".equalsIgnoreCase(word)) {
            return Collections.singletonList("Wi-Fi");
        } else if ("genomen".equals(word)) {
            return Collections.singletonList("genommen");
        } else if ("Preis-Leistungsverhltnis".equals(word)) {
            return Collections.singletonList("Preis-Leistungs-Verhltnis");
        } else if ("ausversehen".equals(word)) {
            return Collections.singletonList("aus Versehen");
        } else if ("getz".equals(word)) {
            return Arrays.asList("jetzt", "geht's");
        } else if ("Trons".equals(word)) {
            return Collections.singletonList("Trance");
        } else if (word.matches(".*ibel[hk]eit$")) {
            suggestion = word.replaceFirst("el[hk]eit$", "ilitt");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.endsWith("aquise")) {
            suggestion = word.replaceFirst("aquise$", "akquise");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.endsWith("standart")) {
            suggestion = word.replaceFirst("standart$", "standard");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.endsWith("standarts")) {
            suggestion = word.replaceFirst("standarts$", "standards");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.endsWith("tips")) {
            suggestion = word.replaceFirst("tips$", "tipps");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.endsWith("tip")) {
            suggestion = word + "p";
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.endsWith("entfehlung")) {
            suggestion = word.replaceFirst("ent", "emp");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.endsWith("oullie")) {
            suggestion = word.replaceFirst("oullie$", "ouille");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.startsWith("[dD]urschnitt")) {
            suggestion = word.replaceFirst("^urschnitt", "urchschnitt");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.startsWith("Bundstift")) {
            suggestion = word.replaceFirst("^Bundstift", "Buntstift");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches("[aA]llmhll?i(g|ch)(e[mnrs]?)?")) {
            suggestion = word.replaceFirst("llmhll?i(g|ch)", "llmhlich");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches(".*[mM]a[jy]onn?[e]se.*")) {
            suggestion = word.replaceFirst("a[jy]onn?[e]se", "ayonnaise");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches(".*[rR]es(a|er)[vw]i[he]?rung(en)?")) {
            suggestion = word.replaceFirst("es(a|er)[vw]i[he]?rung", "eservierung");
            if (!hunspellDict.misspelled(suggestion)) { // suggest e.g. 'Ticketreservierung', but not 'Bldsinnsquatschreservierung'
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches("[rR]eschaschier.+")) {
            suggestion = word.replaceFirst("schaschier", "cherchier");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches(".*[lL]aborants$")) {
            suggestion = word.replaceFirst("ts$", "ten");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches("[pP]roff?ess?ion([e])h?ll?(e[mnrs]?)?")) {
            suggestion = word.replaceFirst("roff?ess?ion([e])h?l{1,2}", "rofessionell");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches("[vV]erstehendniss?(es?)?")) {
            suggestion = word.replaceFirst("[vV]erstehendnis", "Verstndnis");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches("koregier.+")) {
            suggestion = word.replaceAll("reg", "rrig");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches("diagno[sz]ier.*")) {
            suggestion = word.replaceAll("gno[sz]ier", "gnostizier");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches(".*eiss.*")) {
            suggestion = word.replaceAll("eiss", "ei");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.matches(".*uess.*")) {
            suggestion = word.replaceAll("uess", "");
            if (!hunspellDict.misspelled(suggestion)) {
                return Collections.singletonList(suggestion);
            }
        } else if (word.equals("gin")) {
            return Collections.singletonList("ging");
        } else if (word.equals("dh") || word.equals("dh.")) {
            return Collections.singletonList("d.\u202fh.");
        } else if (word.equals("ua") || word.equals("ua.")) {
            return Collections.singletonList("u.\u202fa.");
        } else if (word.matches("z[bB]") || word.matches("z[bB].")) {
            return Collections.singletonList("z.\u202fB.");
        } else if (word.equals("uvm") || word.equals("uvm.")) {
            return Collections.singletonList("u.\u202fv.\u202fm.");
        } else if (word.equals("udgl") || word.equals("udgl.")) {
            return Collections.singletonList("u.\u202fdgl.");
        } else if (word.equals("Ruhigkeit")) {
            return Collections.singletonList("Ruhe");
        } else if (word.equals("angepreist")) {
            return Collections.singletonList("angepriesen");
        } else if (word.equals("halo")) {
            return Collections.singletonList("hallo");
        } else if (word.equalsIgnoreCase("zumindestens")) {
            return Collections.singletonList(word.replace("ens", ""));
        } else if (word.equals("ca")) {
            return Collections.singletonList("ca.");
        } else if (word.equals("Jezt")) {
            return Collections.singletonList("Jetzt");
        } else if (word.equals("Rolladen")) {
            return Collections.singletonList("Rollladen");
        } else if (word.equals("Maname")) {
            return Collections.singletonList("Manahme");
        } else if (word.equals("Manamen")) {
            return Collections.singletonList("Manahmen");
        } else if (word.equals("nanten")) {
            return Collections.singletonList("nannten");
        } else if (word.endsWith("ies")) {
            if (word.equals("Stories")) {
                return Collections.singletonList("Storys");
            } else if (word.equals("Lobbies")) {
                return Collections.singletonList("Lobbys");
            } else if (word.equals("Hobbies")) {
                return Collections.singletonList("Hobbys");
            } else if (word.equals("Parties")) {
                return Collections.singletonList("Partys");
            } else if (word.equals("Babies")) {
                return Collections.singletonList("Babys");
            } else if (word.equals("Ladies")) {
                return Collections.singletonList("Ladys");
            } else if (word.endsWith("derbies")) {
                suggestion = word.replaceFirst("derbies$", "derbys");
                if (!hunspellDict.misspelled(suggestion)) {
                    return Collections.singletonList(suggestion);
                }
            } else if (word.endsWith("stories")) {
                suggestion = word.replaceFirst("stories$", "storys");
                if (!hunspellDict.misspelled(suggestion)) {
                    return Collections.singletonList(suggestion);
                }
            } else if (word.endsWith("parties")) {
                suggestion = word.replaceFirst("parties$", "partys");
                if (!hunspellDict.misspelled(suggestion)) {
                    return Collections.singletonList(suggestion);
                }
            }
        } else if (word.equals("Hallochen")) {
            return Arrays.asList("Hallchen", "hallchen");
        } else if (word.equals("hallochen")) {
            return Collections.singletonList("hallchen");
        } else if (word.equals("ok")) {
            return Arrays.asList("okay", "O.\u202fK."); // Duden-like suggestion with no-break space
        } else if (word.equals("gesuchen")) {
            return Arrays.asList("gesuchten", "gesucht");
        } else if (word.equals("Germanistiker")) {
            return Arrays.asList("Germanist", "Germanisten");
        } else if (word.equals("par")) {
            return Collections.singletonList("paar");
        } else if (word.equals("vllt")) {
            return Collections.singletonList("vielleicht");
        } else if (word.equals("iwie")) {
            return Collections.singletonList("irgendwie");
        } else if (word.equals("sry")) {
            return Collections.singletonList("sorry");
        } else if (word.equals("Zynik")) {
            return Collections.singletonList("Zynismus");
        } else if (word.matches("Email[a-z]{5,}")) {
            String suffix = word.substring(5);
            if (hunspellDict.misspelled(suffix)) {
                List<String> suffixSuggestions = hunspellDict.suggest(suffix);
                suffix = suffixSuggestions.isEmpty() ? suffix : suffixSuggestions.get(0);
            }
            return Collections
                    .singletonList("E-Mail-" + Character.toUpperCase(suffix.charAt(0)) + suffix.substring(1));
        } else if (word.equals("wiederspiegeln")) {
            return Collections.singletonList("widerspiegeln");
        } else if (word.equals("ch")) {
            return Collections.singletonList("ich");
        } else {
            for (Pattern p : ADDITIONAL_SUGGESTIONS.keySet()) {
                if (p.matcher(word).matches()) {
                    return ADDITIONAL_SUGGESTIONS.get(p).apply(word);
                }
            }
        }
        if (!StringTools.startsWithUppercase(word)) {
            String ucWord = StringTools.uppercaseFirstChar(word);
            if (!suggestions.contains(ucWord) && !hunspellDict.misspelled(ucWord)) {
                // Hunspell doesn't always automatically offer the most obvious suggestion for compounds:
                return Collections.singletonList(ucWord);
            }
        }
        String verbSuggestion = getPastTenseVerbSuggestion(word);
        if (verbSuggestion != null) {
            return Collections.singletonList(verbSuggestion);
        }
        String participleSuggestion = getParticipleSuggestion(word);
        if (participleSuggestion != null) {
            return Collections.singletonList(participleSuggestion);
        }
        String abbreviationSuggestion = getAbbreviationSuggestion(word);
        if (abbreviationSuggestion != null) {
            return Collections.singletonList(abbreviationSuggestion);
        }
        // hyphenated compounds words (e.g., "Netflix-Flm")
        if (suggestions.isEmpty() && word.contains("-")) {
            String[] words = word.split("-");
            if (words.length > 1) {
                List<List<String>> suggestionLists = new ArrayList<>(words.length);
                int startAt = 0;
                int stopAt = words.length;
                String partialWord = words[0] + "-" + words[1];
                if (super.ignoreWord(partialWord) || wordsToBeIgnoredInCompounds.contains(partialWord)) { // "Au-pair-Agentr"
                    startAt = 2;
                    suggestionLists.add(Collections.singletonList(words[0] + "-" + words[1]));
                }
                partialWord = words[words.length - 2] + "-" + words[words.length - 1];
                if (super.ignoreWord(partialWord) || wordsToBeIgnoredInCompounds.contains(partialWord)) { // "Seniren-Au-pair"
                    stopAt = words.length - 2;
                }
                for (int idx = startAt; idx < stopAt; idx++) {
                    if (hunspellDict.misspelled(words[idx])) {
                        List<String> list = sortSuggestionByQuality(words[idx], super.getSuggestions(words[idx]));
                        suggestionLists.add(list);
                    } else {
                        suggestionLists.add(Collections.singletonList(words[idx]));
                    }
                }
                if (stopAt < words.length - 1) {
                    suggestionLists.add(Collections.singletonList(partialWord));
                }
                if (suggestionLists.size() <= 3) { // avoid OutOfMemory on words like "free-and-open-source-and-cross-platform"
                    List<String> additionalSuggestions = suggestionLists.get(0);
                    for (int idx = 1; idx < suggestionLists.size(); idx++) {
                        List<String> suggestionList = suggestionLists.get(idx);
                        List<String> newList = new ArrayList<>(
                                additionalSuggestions.size() * suggestionList.size());
                        for (String additionalSuggestion : additionalSuggestions) {
                            for (String aSuggestionList : suggestionList) {
                                newList.add(additionalSuggestion + "-" + aSuggestionList);
                            }
                        }
                        additionalSuggestions = newList;
                    }
                    // avoid overly long lists of suggestions (we just take the first results, although we don't know whether they are better):
                    return additionalSuggestions.subList(0, Math.min(5, additionalSuggestions.size()));
                }
            }
        }
        return Collections.emptyList();
    }

    // Get a correct suggestion for invalid words like greifte, denkte, gehte: useful for
    // non-native speakers and cannot be found by just looking for similar words.
    @Nullable
    private String getPastTenseVerbSuggestion(String word) {
        if (word.endsWith("e")) {
            // strip trailing "e"
            String wordStem = word.substring(0, word.length() - 1);
            try {
                String lemma = baseForThirdPersonSingularVerb(wordStem);
                if (lemma != null) {
                    AnalyzedToken token = new AnalyzedToken(lemma, null, lemma);
                    String[] forms = synthesizer.synthesize(token, "VER:3:SIN:PRT:.*", true);
                    if (forms.length > 0) {
                        return forms[0];
                    }
                }
            } catch (IOException e) {
                throw new RuntimeException(e);
            }
        }
        return null;
    }

    @Nullable
    private String baseForThirdPersonSingularVerb(String word) throws IOException {
        List<AnalyzedTokenReadings> readings = tagger.tag(Collections.singletonList(word));
        for (AnalyzedTokenReadings reading : readings) {
            if (reading.hasPosTagStartingWith("VER:3:SIN")) {
                return reading.getReadings().get(0).getLemma();
            }
        }
        return null;
    }

    // Get a correct suggestion for invalid words like geschwimmt, geruft: useful for
    // non-native speakers and cannot be found by just looking for similar words.
    @Nullable
    private String getParticipleSuggestion(String word) {
        if (word.startsWith("ge") && word.endsWith("t")) {
            // strip leading "ge" and replace trailing "t" with "en":
            String baseform = word.substring(2, word.length() - 1) + "en";
            try {
                String participle = getParticipleForBaseform(baseform);
                if (participle != null) {
                    return participle;
                }
            } catch (IOException e) {
                throw new RuntimeException(e);
            }
        }
        return null;
    }

    @Nullable
    private String getParticipleForBaseform(String baseform) throws IOException {
        AnalyzedToken token = new AnalyzedToken(baseform, null, baseform);
        String[] forms = synthesizer.synthesize(token, "VER:PA2:.*", true);
        if (forms.length > 0 && !hunspellDict.misspelled(forms[0])) {
            return forms[0];
        }
        return null;
    }

    private String getAbbreviationSuggestion(String word) throws IOException {
        if (word.length() < 5) {
            List<AnalyzedTokenReadings> readings = tagger.tag(Collections.singletonList(word));
            for (AnalyzedTokenReadings reading : readings) {
                if (reading.hasPosTagStartingWith("ABK")) {
                    return word + ".";
                }
            }
        }
        return null;
    }

    private boolean ignoreByHangingHyphen(List<String> words, int idx) throws IOException {
        String word = words.get(idx);
        String nextWord = getWordAfterEnumerationOrNull(words, idx + 1);
        nextWord = StringUtils.removeEnd(nextWord, ".");

        boolean isCompound = nextWord != null
                && (compoundTokenizer.tokenize(nextWord).size() > 1 || nextWord.indexOf('-') > 0);
        if (isCompound) {
            word = StringUtils.removeEnd(word, "-");
            boolean isMisspelled = hunspellDict.misspelled(word); // "Stil- und Grammatikprfung" or "Stil-, Text- und Grammatikprfung"
            if (isMisspelled && (super.ignoreWord(word) || wordsToBeIgnoredInCompounds.contains(word))) {
                isMisspelled = false;
            } else if (isMisspelled && word.endsWith("s") && isNeedingFugenS(StringUtils.removeEnd(word, "s"))) {
                // Vertuschungs- und Bespitzelungsmanahmen: remove trailing "s" before checking "Vertuschungs" so that the spell checker finds it
                isMisspelled = hunspellDict.misspelled(StringUtils.removeEnd(word, "s"));
            }
            return !isMisspelled;
        }
        return false;
    }

    private boolean isNeedingFugenS(String word) {
        // according to http://www.spiegel.de/kultur/zwiebelfisch/zwiebelfisch-der-gebrauch-des-fugen-s-im-ueberblick-a-293195.html
        return StringUtils.endsWithAny(word, "tum", "ling", "ion", "tt", "keit", "schaft", "sicht", "ung", "en");
    }

    // for "Stil- und Grammatikprfung", get "Grammatikprfung" when at position of "Stil-"
    @Nullable
    private String getWordAfterEnumerationOrNull(List<String> words, int idx) {
        for (int i = idx; i < words.size(); i++) {
            String word = words.get(i);
            if (!(word.endsWith("-") || StringUtils.equalsAny(word, ",", "und", "oder", "sowie")
                    || word.trim().isEmpty())) {
                return word;
            }
        }
        return null;
    }

    // check whether a <code>word<code> is a valid compound (e.g., "Feynmandiagramm" or "Feynman-Diagramm")
    // that contains an ignored word from spelling.txt (e.g., "Feynman")
    private boolean ignoreCompoundWithIgnoredWord(String word) throws IOException {
        if (!StringTools.startsWithUppercase(word)
                && !StringUtils.startsWithAny(word, "nord", "west", "ost", "sd")) {
            // otherwise stuff like "rumfangreichen" gets accepted
            return false;
        }
        String[] words = word.split("-");
        if (words.length < 2) {
            // non-hyphenated compound (e.g., "Feynmandiagramm"):
            // only search for compounds that start(!) with a word from spelling.txt
            int end = super.startsWithIgnoredWord(word, true);
            if (end < 3) {
                // support for geographical adjectives - although "sd/ost/west/nord" are not in spelling.txt 
                // to accept sentences such as
                // "Der westperuanische Ferienort, das ostargentinische Stdtchen, das sdukrainische Brauchtum, der nordgyptische Staudamm."
                if (word.startsWith("ost") || word.startsWith("sd")) {
                    end = 3;
                } else if (word.startsWith("west") || word.startsWith("nord")) {
                    end = 4;
                } else {
                    return false;
                }
            }
            String ignoredWord = word.substring(0, end);
            String partialWord = word.substring(end);
            boolean isCandidateForNonHyphenatedCompound = !StringUtils.isAllUpperCase(ignoredWord)
                    && (StringUtils.isAllLowerCase(partialWord) || ignoredWord.endsWith("-"));
            boolean needFugenS = isNeedingFugenS(ignoredWord);
            if (isCandidateForNonHyphenatedCompound && !needFugenS && partialWord.length() > 2) {
                return !hunspellDict.misspelled(partialWord)
                        || !hunspellDict.misspelled(StringUtils.capitalize(partialWord));
            } else if (isCandidateForNonHyphenatedCompound && needFugenS && partialWord.length() > 2) {
                partialWord = partialWord.startsWith("s") ? partialWord.substring(1) : partialWord;
                return !hunspellDict.misspelled(partialWord)
                        || !hunspellDict.misspelled(StringUtils.capitalize(partialWord));
            }
            return false;
        }
        // hyphenated compound (e.g., "Feynman-Diagramm"):
        boolean hasIgnoredWord = false;
        List<String> toSpellCheck = new ArrayList<>(3);
        String stripFirst = word.substring(words[0].length() + 1); // everything after the first "-"
        String stripLast = word.substring(0, word.length() - words[words.length - 1].length() - 1); // everything up to the last "-"

        if (super.ignoreWord(stripFirst) || wordsToBeIgnoredInCompounds.contains(stripFirst)) { // e.g., "Senioren-Au-pair"
            hasIgnoredWord = true;
            if (!super.ignoreWord(words[0])) {
                toSpellCheck.add(words[0]);
            }
        } else if (super.ignoreWord(stripLast) || wordsToBeIgnoredInCompounds.contains(stripLast)) { // e.g., "Au-pair-Agentur"
            hasIgnoredWord = true;
            if (!super.ignoreWord(words[words.length - 1])) {
                toSpellCheck.add(words[words.length - 1]);
            }
        } else {
            for (String word1 : words) {
                if (super.ignoreWord(word1) || wordsToBeIgnoredInCompounds.contains(word1)) {
                    hasIgnoredWord = true;
                } else {
                    toSpellCheck.add(word1);
                }
            }
        }

        if (hasIgnoredWord) {
            for (String w : toSpellCheck) {
                if (hunspellDict.misspelled(w)) {
                    return false;
                }
            }
        }
        return hasIgnoredWord;
    }

    static class ExpandingReader extends BufferedReader {

        private final List<String> buffer = new ArrayList<>();
        private final LineExpander lineExpander = new LineExpander();

        ExpandingReader(Reader in) {
            super(in);
        }

        @Override
        public String readLine() throws IOException {
            if (buffer.isEmpty()) {
                String line = super.readLine();
                if (line == null) {
                    return null;
                }
                buffer.addAll(lineExpander.expandLine(line));
            }
            return buffer.remove(0);
        }
    }

    @Override
    protected boolean isQuotedCompound(AnalyzedSentence analyzedSentence, int idx, String token) {
        if (idx > 3 && token.startsWith("-")) {
            return StringUtils.equalsAny(analyzedSentence.getTokens()[idx - 1].getToken(), "", "\"")
                    && StringUtils.equalsAny(analyzedSentence.getTokens()[idx - 3].getToken(), "", "\"");
        }
        return false;
    }

    /* (non-Javadoc)
     * @see org.languagetool.rules.spelling.SpellingCheckRule#addProhibitedWords(java.util.List)
     */
    @Override
    protected void addProhibitedWords(List<String> words) {
        if (words.size() == 1) {
            if (words.get(0).endsWith(".*")) {
                wordStartsToBeProhibited.add(words.get(0).substring(0, words.get(0).length() - 2));
            } else if (words.get(0).startsWith(".*")) {
                wordEndingsToBeProhibited.add(words.get(0).substring(2));
            } else {
                super.addProhibitedWords(words);
            }
        } else {
            super.addProhibitedWords(words);
        }
    }

    /* (non-Javadoc)
     * @see org.languagetool.rules.spelling.hunspell.HunspellRule#isAcceptedWordFromLanguage(org.languagetool.Language, java.lang.String)
     */
    @Override
    protected boolean isAcceptedWordFromLanguage(Language language, String word) {
        // probably an abbreviation, e.g. "DOE" -> "Department of Energy"
        return "en".equals(language.getShortCode()) && StringUtils.isAllUpperCase(word);
    }
}