Inside Baseball: Coverage, Quality, and Culture in the Global WordNet.

2017 
Inside Baseball: Coverage, quality, and culture in the Global WordNet The Global WordNet is succeeding in producing relatively open linguistic data that is coordinated to a degree among numerous languages. The project has grown organically, with no overall plan or direction. The result is a certain amount of incoherence in determining what items should be treated in wordnets, and how the various wordnets should aspire to consistent quality. Using the example of terms related to baseball, which constitute a non-trivial portion of the Princeton WordNet, this paper discusses problems of coverage selection both for English and for other languages, as well as methods to improve quality and depth through public review of current content, and contribution of missing terms and definitions. It is proposed that proper names be removed entirely from WordNet and treated as a separate project, and that individual languages produce annexes of indigenous concepts that can be readily considered within sister projects as a supplement to the Anglo-American weighting of the current endeavor. To produce a consistent product that transmits inter-intelligible understanding at a high level across languages, it is proposed that an open committee of interested stakeholders convene to consider the project's goals and develop a roadmap for how to achieve them. Baseball dla zaawansowanych: pokrycie leksykalne, jakośc i kultura w Global WordNet Global WordNet z powodzeniem tworzy stosunkowo otwarte dane jezykowe, do pewnego stopnia powiązane pomiedzy wieloma jezykami. Projekt zyje wlasnym zyciem, bez zadnego ogolnego planu ani kierunku. Rezultatem jest pewna niespojnośc w określaniu, ktore elementy powinny znaleźc sie w wordnetach oraz w jaki sposob rozne wordnety powinny dązyc do utrzymania tej samej jakości. Na przykladzie terminow związanych z baseballem, ktore zajmują niemalą cześc Princeton WordNet, niniejszy artykul omawia problemy wyboru pokrycia leksykalnego zarowno dla jezyka angielskiego, jak i innych jezykow, a takze metody poprawy jakości poprzez publiczny przegląd aktualnych treści oraz dodanie brakujących terminow i definicji. Proponuje sie, aby nazwy wlasne zostaly calkowicie usuniete z WordNetu i potraktowane jako odrebny projekt, a w ramach poszczegolnych jezykow utworzone zostaly aneksy rodzimych pojec, ktore mozna wziąc pod uwage w ramach siostrzanych projektow jako uzupelnienie obecnego anglo-amerykanskiego przedsiewziecia. W celu stworzenia spojnego produktu, ktory bedzie charakteryzowal sie wzajemną zrozumialością na wysokim poziomie w roznych jezykach, proponuje sie zwolanie otwartego komitetu zainteresowanych podmiotow, aby rozwazyc cele projektu i opracowac plan dzialania, w jaki sposob cele te osiągnąc.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    5
    References
    0
    Citations
    NaN
    KQI
    []