Drücken Sie „Enter“, um den Inhalte zu überspringen

JDerm – Die Schwierigkeit deutscher Informationsbroschüren zu Psoriasis und Psoriasis-Arthritis: Automatisierte Lesbarkeit und Wortschatzanalyse | Wiesner

Dies ist ein automatisch übersetzter Artikel. Er kann nur einer groben Orientierung dienen. Das Original gibt es hier: JMIR Dermatology

Einführung

Überblick

Psoriasis (Internationale Klassifikation der Krankheiten Zehnte Ausgabe [ICD-10] Code: L40) ist eine der häufigsten chronisch entzündlichen Hauterkrankungen in der Dermatologie, die sich als schuppige, erythematöse Plaques manifestiert. Laut Griffiths und Barker []“Die Inzidenz bei weißen Personen wird auf 60 Fälle pro 100 000 Einwohner pro Jahr geschätzt.“ Frauen und Männer sind gleichermaßen von der Krankheit betroffen. Darüber hinaus ist diese Hauterkrankung mit einer Form von entzündlicher Arthritis verbunden, die als Psoriasis-Arthritis bekannt ist (ICD-10: M07 *). []. Die gesundheitsbezogene Lebensqualität der Patienten wird durch beide Erkrankungen erheblich beeinträchtigt [-]und „ist ähnlich wie bei anderen großen medizinischen Krankheiten“ [].

Die Entwicklung der Psoriasis und ihre klinische Ausprägung werden von mehreren externen Faktoren beeinflusst, darunter Rauchen, Gewicht und stressige Lebensereignisse []. Darüber hinaus wird bei Patienten mit Psoriasis-Arthritis mit mittelschweren bis schweren Gelenksymptomen ein Verlust der Arbeitsproduktivität gemeldet [].

Selbstmanagement spielt eine wichtige Rolle bei der Bewältigung der Auswirkungen von Psoriasis. In diesem Zusammenhang ist es wichtig, einen konsistenten Therapieansatz zu verfolgen []. Gemäß []Die Hauptgründe für die fehlende Behandlung waren „Alkohol trinken, satt werden, Vergesslichkeit und zu beschäftigt sein“. Patienten benötigen jedoch nicht nur ein gewisses Maß an Wissen, um ihre persönliche Einhaltung hoch zu halten, sondern auch psychologische Unterstützung [] Der Austausch mit anderen Patienten kann ebenfalls wertvoll sein, um das Selbstmanagement zu verbessern []. Neben der Beratung von Angehörigen der Gesundheitsberufe können Psoriasis-Patienten auch (emotionale) Unterstützung und Therapieberatung von anderen Betroffenen in Anspruch nehmen, beispielsweise in Online-Support-Communities []. Dennoch berichteten Renzi et al. In einer Studie mit 240 italienischen Patienten, dass []::

Der Wissensstand über die Krankheit war mit nur 17,0% und 21,4% der Patienten nicht so hoch[s] mit [Psoriasis] und [Psoriatic Arthritis]mit einem guten Kenntnisstand über die Behandlung von Psoriasis.

Informationssuchende Psoriasis / Psoriasis-Arthritis-Patienten erhalten verschiedene Formen von Material zur Gesundheitserziehung, z. B. gedruckte Gesundheitsbroschüren. 1994 untersuchten Feldman et al. Die Lesbarkeit solcher Lehrmaterialien in englischer Sprache []. Die Autoren stellten fest, dass für das Textmaterial ein US-amerikanisches Bildungsniveau zwischen den Klassen 8 und 12 erforderlich war, das über dem empfohlenen Grad für Textmaterial für die Gesundheitserziehung lag [-]. Diese Ergebnisse können jedoch nicht improvisiert auf andere Sprachen wie Italienisch oder Deutsch übertragen werden, da sich die Bildungssysteme und Spracheigenschaften erheblich unterscheiden.

Ein weiteres Hauptproblem schriftlicher Patienteninformationen ist die Kluft zwischen der Sprache von Experten und Laien. Selbst mit einem höheren Bildungsniveau stellen medizinische Vokabeln wie Diagnose- und Behandlungskonzepte Probleme für die von einer Krankheit Betroffenen dar []. Darüber hinaus sind die medizinischen Begriffe, die mit dem Ursprung einer Krankheit verbunden sind und von Angehörigen der Gesundheitsberufe oder Patienten verwendet werden, in der Regel unterschiedlich [-].

Um die Schwierigkeit von geschriebenem Textmaterial zu beurteilen, gibt es verschiedene Metriken für die englische Sprache [-]. Die manuelle Berechnung dieser Metriken kann jedoch für große Dokumentensammlungen schwierig und zeitaufwändig sein und ist daher mit einem hohen Bedarf an personellen oder finanziellen Ressourcen verbunden. Angesichts der Vielzahl der im Internet verfügbaren Broschüren zu Psoriasis / Psoriasis-Arthritis erscheint ein manueller oder halbautomatischer Ansatz alles andere als praktisch. In diesem Zusammenhang wurde nach bestem Wissen der Autoren bisher keine Studie zu Psoriasis / Psoriasis-Arthritis-spezifischem Material zur Gesundheitserziehung in deutscher Sprache veröffentlicht, das Methoden des maschinellen Lernens anwendet und die Lesbarkeit und den Wortschatz in vollautomatischer Form berechnet Ansatz.

Diese Studie präsentiert eine automatisierte, computergestützte Lesbarkeits- und Vokabularanalyse von 68 Patienteninformationsbroschüren zu Psoriasis und Psoriasis-Arthritis in deutscher Sprache. Die Schwierigkeitsbewertung dieser Broschüren erfolgte anhand einer deutschen Adaption der Flesch-Reading Ease (FRE) [] Rahmen [], die vierte Wiener Formel (deutsch: Wiener Sachtextformel, WSTF) []und eine vokabularorientierte Methode, die auf einer Support Vector Machine (SVM) basiert [].

Verwandte Arbeiten

Schriftliche oder mündliche Patienteninformationen sollten wissenschaftliche Beweise für eine Krankheit liefern, so dass die Patienten sie verstehen können. Der Einzelne muss in der Lage sein, die wesentlichen Chancen und Risiken der verfügbaren Therapiestrategien einzuschätzen und mit seiner Lebenssituation in Einklang zu bringen. In diesem Zusammenhang beschreibt Gesundheitskompetenz nach Ratzen und Parker []::

Inwieweit Einzelpersonen in der Lage sind, grundlegende Gesundheitsinformationen und -dienste zu erhalten, zu verarbeiten und zu verstehen, die für angemessene Gesundheitsentscheidungen erforderlich sind.

Dieses Konzept ist besonders wichtig, da eine geringe Gesundheitskompetenz mit einem schlechteren allgemeinen Gesundheitszustand und einer erhöhten Sterblichkeit verbunden ist, insbesondere für höhere Altersgruppen [].

Um den Grad der Gesundheitskompetenz eines Einzelnen zu quantifizieren, bietet die Europäische Umfrage zur Gesundheitskompetenz ein Instrument mit einer Skala von 1 (niedrigster) bis 50 (höchster). Es wurde verwendet, um die Gesundheitskompetenz in verschiedenen europäischen Ländern zu vergleichen. Eine Analyse von Zok zeigt eine durchschnittliche Punktzahl von 31,9 für deutsche Teilnehmer, die unter der europäischen Durchschnittspunktzahl (33,8) lag. []. In einer Studie aus dem Jahr 2016 berichteten Schaeffer et al., Dass „54,3% von [German study participants] Es wurde festgestellt, dass die Gesundheitskompetenz begrenzt ist “(n = 2000). [,]. Diese Ergebnisse unterstützen den Bedarf an Lehrmaterialien, die den Fähigkeiten ihrer Leser entsprechen. Das heißt, diese Materialien müssen mit einer ausreichenden Lesbarkeit geschrieben sein. Folglich sollte ein auf Experten ausgerichtetes Vokabular vermieden werden, da es den Patienten Hindernisse auferlegt, die Verständlichkeit der empfohlenen Therapieempfehlungen beeinträchtigt oder die allgemeine Einhaltung von Behandlungsplänen beeinträchtigen kann.

In diesem Zusammenhang spielt die Analyse von Material zur Gesundheitserziehung eine wichtige Rolle bei der Textproduktion oder bei der Verbesserung des vorhandenen Materials. Mehrere Studien ergaben jedoch, dass Material zur Gesundheitserziehung häufig mit geringer Lesbarkeit verfasst und veröffentlicht wird, was die Verständlichkeit für die beabsichtigten Zielgruppenleser verringert oder behindert [-]. Verschiedene medizinische Subdisziplinen oder Krankheiten waren Gegenstand von Lesbarkeitsbewertungen. Dazu gehören unter anderem: (1) Krebs; (2) Herzkrankheiten; (3) Lungenerkrankungen; (4) Nierenerkrankungen; (5) ophthalmologische Bedingungen; oder (6) dermatologische Zustände. Viele andere medizinische Subdisziplinen wurden bewertet, und sowohl die vorherige Liste als auch verwandte Literaturhinweise sollten nicht als vollständig angesehen werden. Stattdessen heben die ausgewählten Studien aktuelle Studien auf dem breiten Gebiet der Bewertung der Lesbarkeit hervor.

Im Jahr 2004 analysierten Friedman et al. Krebsaufklärungsmaterial von 55 Websites []. Sie berichteten über einen mittleren FRE-Wert von 41,6; Das heißt, die Lesbarkeit der präsentierten Inhalte war auf College-Ebene, was einer US-Schulstufe der Klasse 13+ entspricht. Ihre Analyse ergab jedoch Unterschiede zwischen verschiedenen Krebsarten, da „Brustkrebsstellen mit leichteren Lesestufen geschrieben wurden“. Eine ähnliche Studie wurde 2018 von Basch et al. Vorgestellt, in der die Lesbarkeit von Prostatakrebsmaterialien im Internet anhand von fünf verschiedenen Metriken bewertet wurde []. Sie berichteten, dass die „Mehrheit der Websites schwer lesbar war“ und kamen zu dem Schluss, dass „eine große Mehrheit der im Internet verfügbaren Informationen über Prostatakrebs für viele Personen nicht lesbar sein wird“. Eine kürzlich durchgeführte Analyse gedruckter Broschüren für Melanompatienten in deutscher Sprache ergab, dass der mittlere FRE für neun manuell analysierte Broschüren 43 betrug []. Die Autoren berichteten von „geringer Lesbarkeit in mindestens der Hälfte der Broschüren“ und betonten die Notwendigkeit von Inhalten und didaktischer Überarbeitung des Lehrmaterials.

Im Jahr 2012 untersuchten Taylor-Clarke et al. Die Eignung und Lesbarkeit von schriftlichem Material (n = 18), das in Kliniken für Herzinsuffizienz bereitgestellt und im Internet verfügbar ist []. In einer nicht computergestützten Analyse verwendeten die Autoren die Fry-Lesbarkeitsformel und stellten fest, dass die Lesbarkeitsstufen „zwischen der 3. und 15. Klassenstufe lagen“ und die durchschnittliche Lesbarkeitsstufe die 8. Klassenstufe betrug. Ähnliche Ergebnisse wurden von Kher, Johnson und Griffith berichtet [] in ihrer Studie, die Material zur Gesundheitserziehung über Herzinsuffizienz von 70 Websites enthielt. Ihr primäres Ergebnis war, dass „nur 5 von 70 Websites innerhalb der Grenzen der empfohlenen Lesbarkeitsstufe der sechsten Klasse lagen“. Der mittlere FRE-Wert betrug 48,87.

Eine aktuelle Studie zur Aufklärung über Herzinsuffizienz über eine mobile App [] analysierte den In-App-Inhalt mit einem Online-Tool zur Berechnung der Lesbarkeit. Die Autoren berichteten, „obwohl die Verwendung medizinischer Terminologie in Patientenaufklärungsmaterial oft unvermeidbar ist“, was zu vielen mehrsilbigen medizinischen Begriffen führt, dem „CHF [congestive heart failure] Die Info-App enthielt weniger mehrsilbige Begriffe. “ Sie berechneten einen Mittelwert der Lesestufe der sechsten Klasse für den In-App-CHF-Inhalt.

Andere Studien untersuchten die Lesbarkeit von Lehrmaterial für Patienten mit Lungenerkrankungen oder deren Familienangehörige. Eine Studie aus dem Jahr 2016 umfasste 109 patientengesteuerte Online-Informationsressourcen und verwendete zehn verschiedene Lesbarkeitsmetriken []. Weiss et al. Fanden heraus, dass nur „10 Artikel (9%) unter einer sechsten Klasse geschrieben wurden“, aber der „Durchschnitt [FRE] Punktzahl war 52 “im Bereich von 18 bis 78; Die Klassenstufe reichte von „9,2 (www.cancer.gov) bis 15,2 (www.wikipedia.org)“, wenn sie nach der übergeordneten Website gruppiert wurde. Eine Studie von Hansberry et al []bewertete die Lesbarkeit von Lehrmaterial zu den „gesundheitlichen Vorteilen des Lungenkrebs-Screenings“, das für die breite Öffentlichkeit bestimmt war, unter Verwendung von zehn Lesbarkeitsinstrumenten. Die Autoren berichteten, dass „von 80 Artikeln 62,5% eine High-School-Ausbildung zum Verständnis benötigten“.

In einer ähnlichen Studie überprüften Haas et al. 46 Websites zum Lungenkrebs-Screening []. Das durchschnittliche Gesamtniveau der Flesch-Kincaid-Klasse betrug durchschnittlich 10,6 (SD 2,2). Im Jahr 2017 haben Fullmann et al [] bewertete Verbraucherinformationen von 26 Inhalatoren für chronisch obstruktive Lungenerkrankungen aus der Health Canada Drug Product Database. Sie kamen zu dem Schluss, dass der Abschnitt mit den Medikamenteninformationen im Durchschnitt „schwer zu lesen“ oder „schwer“ (FRE = 47,8), der Abschnitt mit Anweisungen jedoch „leicht“ oder „ziemlich leicht“ (FRE = 79,0) zu lesen war.

Für das Gebiet der Nephrologie haben Thomas et al [] analysierte Wikipedia als Ressource für die Patientenaufklärung, einschließlich 69 öffentlich zugänglicher Artikel. Der insgesamt gemeldete mittlere FRE betrug 19,4, was einem Mangel an Lesbarkeit entspricht. Darüber hinaus betrug die durchschnittliche Flesch-Kincaid-Klassenstufe 15,1, was darauf hinweist, dass die Leser von Wikipedia eine Ausbildung auf Hochschulniveau benötigten. Eine systematische Übersicht von Morony et al [] Dazu gehörten 80 Materialien zur Patientenaufklärung über chronische Nierenerkrankungen aus den USA, Großbritannien und Australien. Bei der Bewertung mit dem Flesch-Kincaid-Instrument der Klassenstufe „erforderten die meisten Materialien mindestens die Lesestufe 9“. Die Autoren betonten, dass der „kognitive Rückgang bei Patienten“, der unter den Auswirkungen dieser Krankheit leidet, zu einer „geringeren Alphabetisierung als der durchschnittliche Patient“ führt und dass Inhaltsanbieter das Textmaterial sorgfältig zusammenstellen sollten.

Online-Informationen zu ophthalmologischen Patienten wurden von Edmunds et al []. Sie bewerteten 160 Websites und meldeten einen mittleren FRE-Wert von 52,1. Ihre Analyse ergab, dass „83% [..] als von „schwieriger“ Lesbarkeit. “ Die Autoren berichteten auch, dass „gemeinnützige Webseiten wesentlich länger waren als kommerzielle Webseiten.“ In einer Einzelinstitutstudie wurden Unterrichtsmaterialien zum Glaukom bewertet []. Die Autoren überprüften die Lesbarkeit der Handzettel ihrer Einrichtung und stellten eine Flesch-Kincaid-Lesestufe der 10. Klasse fest. Nach der „Anwendung von Richtlinien zum Schreiben von leicht verständlichem Material“ und der Überarbeitung des Materials hatte sich die Lesbarkeit auf „eine Lesestufe der 6. Klasse“ verbessert, was besser für Patienten mit geringer Gesundheitskompetenz geeignet ist.

Tulbert, Snyder und Brodell [] verglich die Lesbarkeit von „drei Quellen für Patientenaufklärungsmaterial im Internet (WebMD.com, Wikipedia.org und MedicineOnline.com) […] mit Materialien der American Academy of Dermatology [AAD]”. Die auf Wikipedia.org gefundenen Lehrmaterialien waren schwieriger zu verstehen als AAD und MedicineOnline. Tulbert et al. Kategorisierten die abgerufenen Broschüren nach verschiedenen Themen. Psoriasis-Broschüren (keine Unterscheidung zwischen Psoriasis / Psoriasis-Arthritis) wurden mit einem mittleren FRE von 39,5 für die AAD-Materialien und einem mittleren FRE von 53,6 für die WebMD-Ressourcen gefunden.

Die Lesbarkeit von Lehrmaterialien für Patienten mit Psoriasis wurde 1994 untersucht []. Die Autoren stellten fest, dass das in englischer Sprache verfasste Textmaterial ein Bildungsniveau zwischen den Klassen 8 und 12 erfordert, das deutlich über dem empfohlenen Klassenniveau für die Gesundheitserziehung liegt. In ihrer Analyse betrug der mittlere FRE-Wert 52,7. Eine Folgestudie wurde 20 Jahre später von Smith durchgeführt []. Die Analyse dieser Broschüren in englischer Sprache ergab, dass überarbeitete, neuere Online-Ressourcen zu Psoriasis, die von drei Organisationen bereitgestellt wurden, immer noch „die gewünschte 6. Klassenstufe nicht erreichen“. [].

Ziele der Studie

Die Autoren beschlossen, sich auf Broschüren zu konzentrieren, die kostenlos im Internet erhältlich und in deutscher Sprache verfasst sind und sich an Patienten mit Psoriasis (Vulgaris) oder Psoriasis-Arthritis richten. In diesem Zusammenhang war das Ziel dieser Studie dreifach: (1) Analyse der aktuellen Situation, dh Umfang und Umfang der Informationsbroschüren zu Psoriasis / Psoriasis-Arthritis bei (deutschsprachigen) Patienten; (2) Quantifizierung des Grads der Lesbarkeit des Textmaterials und der Art des in den identifizierten Broschüren verwendeten Vokabulars; und (3) zu bewerten, ob verschiedene Arten von Broschüren besser für Bürger mit geringerer Gesundheitskompetenz geeignet sind. Daher kann diese Studie eine Grundlage für Forscher bieten, die ihre Ergebnisse validieren möchten.

Methoden

Studiendesign

Diese Untersuchung des Unterrichtsmaterials bestand aus zwei Phasen. Um Ziel 1 zu beantworten, wurde zunächst die Datenextraktion manuell unter Verwendung einer Internetsuche nach PDF-Dokumenten durchgeführt, die speziell für Psoriasis- und Psoriasis-Arthritis-Patienten geschrieben wurden und diese ansprechen. Der Abruf war auf PDF-Dokumente beschränkt. Dieser Dateityp wurde gewählt, da die entsprechenden Dokumente in elektronischem Format (maschinenlesbar) leicht zugänglich sind und auch in gedruckter Form verteilt werden können. Im Allgemeinen sind diese Dokumente stark strukturiert und werden von Verlagsinstituten Korrektur gelesen.

In der folgenden Phase wurde das in Phase 1 gesammelte Material zur Gesundheitserziehung verwendet und eine computergestützte Lesbarkeits- und Vokabularanalyse durchgeführt. Beide Analysen sollten die Forschungsziele 2 und 3 beantworten.

Studieneinstellung

Patienteninformationsbroschüren zu Psoriasis (Vulgaris) und Psoriasis-Arthritis wurden gesammelt. Alle Broschüren mussten im Internet frei verfügbar sein. Nur-Druck-Broschüren oder Multimedia-Inhalte wurden nicht berücksichtigt. Dokumente konnten aufgenommen werden, wenn sie: (1) Informationen zu Psoriasis und Psoriasis-Arthritis für Patienten lieferten; (2) Informationen in deutscher Sprache zur Verfügung gestellt; und (3) waren frei zugänglich. Wenn diese Kriterien nicht erfüllt waren, wurden die zugehörigen Dokumente von der Lesbarkeits- und Vokabularanalyse ausgeschlossen.

Für die Identifizierung relevanter Broschüren wurde der Fachbegriff „Psoriasis“ gewählt, begleitet von dem laienfreundlicheren deutschen Begriff „Schuppenflechte“. Die beiden Begriffe beziehen sich auf dasselbe Konzept, und Patienten in Deutschland kennen beide. Der deutsche Begriff „Broschüre“ wurde aufgenommen, um Lehrmaterialien zu finden, die eher für Patienten als für andere Arten von PDF-Dateien geeignet sind, wie z. B. Beilagen für Arzneimittelpakete oder elektronische Präsentationsfolien von Medizinern. Die DuckDuckGo-Suchmaschine wurde verwendet, um das Web mit den folgenden Suchbegriffen zu durchsuchen: + Broschüre + Psoriasis-Dateityp: pdf (Suchbegriffe A), + Broschüre + Schuppenflechte-Dateityp: pdf (Suchbegriffe B), + Schuppenflechte-Dateityp: pdf (Suchbegriffe) C) und + Psoriasis-Dateityp: pdf (Suchbegriffe D).

Nach der Eliminierung von Duplikaten überprüften zwei Autoren in einer gemeinsamen Sitzung die Titel und den Inhalt der abgerufenen Informationsbroschüren, um zu überprüfen, ob das Lehrmaterial auf Patienten mit Psoriasis / Psoriasis-Arthritis abzielte. Daher wurden während dieses manuellen Schritts falsch positive Abrufergebnisse entfernt.

Lesbarkeitsanalyse

Definition

Lesbarkeit [] ist ein Begriff, der die Eigenschaften von geschriebenem Text in Bezug auf die Kompetenz, Motivation und das Verständnis der Leser eines Dokuments beschreibt []. Dies hängt von der Komplexität der Textstruktur, der Satzstruktur und dem verwendeten Vokabular ab.

Flesch Reading Ease Scale

Eine gut etablierte Lesbarkeitsskala für die englische Sprache ist die Flesch Reading Ease-Metrik []. Die FRE misst die Lesbarkeit eines Textes über seine durchschnittliche Satzlänge (ASL) und die durchschnittliche Anzahl von Silben pro Wort (ASW). Es beruht auf der Tatsache, dass kurze Wörter oder Sätze normalerweise leichter zu verstehen sind als längere. Für diese Analyse haben wir jedoch das modifizierte FRE für die deutsche Sprache von Toni Amstad angewendet []::

Wiener Formel

Im Gegensatz zur FRE ist die Wiener Formel (WSTF) keine angepasste Version für die deutsche Sprache. Stattdessen stützt es sich auf Arbeiten von Bamberger und Vanacek [], der die Grundlagen des deutschen Textmaterials analysierte und mindestens fünf Versionen der Wiener Formel für Prosa- und Sachtexte ableitete. In der Regel wird der vierte WSTF für Textanalysen verwendet. Diese Metrik basiert auch auf der ASL und dem Anteil von (komplexen) Wörtern mit drei oder mehr Silben (MS):

Wortschatzklassifikation

Für die deutsche Sprache sind die durchschnittliche Länge der Wörter oder die Anzahl der Silben kein guter Indikator dafür, ob ein Begriff / Konzept mit Laien kompatibel ist, was bedeutet, dass er von Personen mit einem Bildungsniveau der Klassen 6 bis 7 leicht verstanden werden kann. Dies liegt daran, dass die deutsche Grammatik die Erstellung und Verwendung vieler zusammengesetzter Wörter (z. B. Hauterkrankheit, Hautunverträglichkeit, Kontaktallergie) ermöglicht, die zwar langwierig, aber für einen durchschnittlichen Patienten recht laienfreundlich sind. Es können verschiedene Techniken des maschinellen Lernens eingesetzt werden, um die Einschränkungen etablierter Lesbarkeitsmaßnahmen auszugleichen [,]. Aus diesem Grund haben wir den vokabularbasierten SVM-Ansatz als zusätzliche Dimension der Textanalyse hinzugefügt.

In früheren Arbeiten []Es wurde eine vokabularbasierte Berechnung eines „Expertenlevels“ unter Verwendung eines speziell ausgebildeten SVM für Deutsch vorgestellt, die auf Krebsinformationsbroschüren angewendet wurde [] und gilt auch für Psoriasis-Informationsbroschüren. Um diesen vorab trainierten Klassifikator zur Quantifizierung der vokabularbasierten Schwierigkeit von medizinischem Textmaterial zu verwenden, sind mehrere Vorverarbeitungsschritte erforderlich []. In einem ersten Schritt wird jeder Text in Token (dh einzelne Wortfragmente) aufgeteilt. Zweitens werden nicht menschlich lesbare Markups (z. B. XML-Tags) sowie Stoppwörter entfernt (z. B. er / sie / es). Dies ist wichtig, da diese Arten von Token die Schwierigkeit eines Textes nicht beeinflussen. Als nächstes werden die verbleibenden Token auf ihre Stammformen reduziert (z. B. Operationen werden chirurgischer), um sprachliche Variationen desselben Grundkonzepts zu eliminieren. Schließlich wird der Textinhalt eines Dokuments basierend auf zuvor ausgewählten Merkmalen in seine mathematische Darstellung umgewandelt, ähnlich wie in einer Studie von Keinki et al []. In diesem Zusammenhang stellen Merkmale charakteristische Begriffe aus dem medizinischen Bereich dar und beeinflussen dadurch die vokabularbasierte Schwierigkeit eines Textes.

Um den Grad der „Expertenorientierung“ des Textmaterials zu quantifizieren, wird das Vokabularmaß (L) ∈ verwendet [1,…,10] ist definiert. Es verwendet den obigen SVM-Klassifikator. In diesem Zusammenhang weisen höhere Werte von L darauf hin, dass ein akademisches (medizinisches) Hintergrundwissen oder eine Berufserfahrung im medizinischen Bereich erforderlich ist. Ein Wert von> 7 entspricht einem sehr fachkundigen Text, ein Wert von 5-6 für einen schwierigen Text, ein Wert von 4-5 für einen moderaten Text (Laien mit medizinischem, pädagogischem Hintergrund), ein Wert von 3-4 zu einem einfachen Text (Mittelstufe / Realschule) und einem Wert von <3 zu einem sehr einfachen Text (Grundschule / Grundschule).

Schwierigkeit

Die oben genannten Instrumente verwenden unterschiedliche Skalen, um Schwierigkeiten auszudrücken, entweder in Bezug auf Lesbarkeit oder Wortschatz. Daher erscheint es ratsam, diese Skalen unabhängigen Klassen zuzuordnen, die die Schwierigkeit viel einfacher ausdrücken. Das in dieser Studie verwendete Mapping ist in dargestellt.

.

Tabelle 1.
                Zuordnung von Lesbarkeits- und Vokabularinstrumentenskalen zu entsprechenden Klassen (Labels). Angepasst nach [].
Diese Tabelle anzeigen

Computergestützte Verarbeitungsschritte

Beim Parsen eines Textdokuments werden dessen Struktur und Fragmente nach den Regeln der Grammatik einer natürlichen Sprache analysiert. In der Regel enthalten moderne Textdokumente (z. B. PDF, DOC, DOCX) Metadaten, die ihre interne Struktur oder externe Darstellung beschreiben. In diesem Zusammenhang verarbeiten Textparser die beschreibende Markup-Struktur solcher Dokumentformate. Das Hauptziel dieses Prozesses ist es, die Rohversion eines Textes ohne verbleibende technische Markierungen zu extrahieren, die strukturelle Informationen beschreiben. Dazu gehört in der Regel, wie ein Absatz ausgerichtet ist, zu welchem ​​Abschnitt er gehört, ob der Text fett formatiert ist, ob er Abbildungen oder Tabellen enthält usw. [] (Weitere Einzelheiten finden Sie in den Kapiteln 5 und 6).

Bevor ein Parser Rohtextdaten extrahieren kann, muss eine Dokumentensammlung erstellt werden. Im Rahmen dieser Studie wurden alle Informationsbroschüren als PDF-Dateien heruntergeladen. Diese Dateien wurden automatisch in Dokumente im DOCX-Format konvertiert und stellen die Eingabe unseres Analyse-Frameworks dar. Die rechnerischen Verarbeitungsschritte zur Berechnung der Lesbarkeit und der Vokabularwerte für jedes Dokument folgen dem in dargestellten Workflow.

.
Abbildung 1. Arbeitsablauf der Verarbeitungsschritte und der beteiligten Softwarekomponenten: (1) Extraktion von Textinhalten; (2) eine Sammlung von Aufgaben zur Datenaufbereitung und -bereinigung; und (3) Berechnung der Lesbarkeits- und Vokabularmetriken. Das Analyse-Framework verarbeitet PDF, DOC, DOCX als Eingabeformat und gibt für jedes verarbeitete Dokument eine zusammenfassende Excel-Tabelle aus. SVM: Support Vector Machine; FRE: Flesch Reading Ease; WSTF: Vierte Wiener Formel (deutsch: Wiener SachTextFormel).
Sehen Sie sich diese Abbildung an

Dokumentieren Sie zunächst Parser aus dem Apache Tika-Framework [] wurden angewendet, um den tatsächlichen Textinhalt zu extrahieren. In einem zweiten Schritt wurde der extrahierte Text von Störungsartefakten (z. B. verschiedenen Bindestrichcodierungsschemata) gereinigt. Schließlich wurden die oben genannten Lesbarkeits- und Vokabularmetriken für jede Broschüre von einem in Java geschriebenen selbst implementierten Analyserahmenwerk berechnet, das zuvor anhand von Referenzmaterial getestet wurde. Für die Satzerkennung stützt sich das Analyse-Framework auf die Apache OpenNLP-Bibliothek [] und ihr allgemein akzeptiertes Satzmodell für die deutsche Sprache []. Liangs Silbentrennungsalgorithmus [] wurde verwendet, um die Anzahl der Silben zu schätzen. Zur Reduzierung der Stielform wurde laut Porter der Schneeball-Stemmer eingesetzt []. Die Analyse wurde am 21. August 2019 auf einem 64-Bit-Computer unter Mac OS 10.14.6 mit Java 11.0.4 (Oracle Corporation, Redwood Shores, Kalifornien, USA) durchgeführt.

Statistische Analyse

Ein zweiseitiger Wilcoxon-Test mit zwei Stichproben [], auch bekannt als Mann-Whitney U. Test, wurde angewendet, um zu testen, ob die Schwierigkeit von Broschüren zweier Themengruppen unterschiedlich ist (H.0: μ1= μ2, H.1: μ1≠ μ2Alpha = 0,05). Wenn P.<0,05, H.1 wird akzeptiert, da es einen signifikanten Unterschied in Bezug auf die Lesbarkeit zwischen zwei Gruppen gibt. Das nichtparametrische U. Der Test wurde gewählt, da die Anzahl der Broschüren für mehrere Themengruppen eher gering war (n <10) und keine Normalverteilung angenommen werden konnte. Die Daten wurden mit der Statistiksoftware R (The R Foundation, Wien, Österreich) Version 3.6.1 auf einem Linux, Ubuntu 18.04 LTS / 64-Bit-Computer analysiert.

Ergebnisse

Hauptergebnisse

Der Erwerb von Broschüren zu Psoriasis / Psoriasis-Arthritis wurde am 19. und 20. August 2019 von zwei der Autoren durchgeführt. In Anbetracht der Suchbegriffe und der Einschlusskriterien konnten 73 Broschüren aufgenommen werden, von denen fünf entweder als doppelter Inhalt oder als zu allgemein identifiziert wurden (dh sie waren unspezifisch oder deckten andere dermatologische Themen ab). Das Flussdiagramm in zeigt den Datenerfassungsprozess mit allen Details.

.
Abbildung 2. Datenerfassungsprozess mit den Suchbegriffen A-D, wie im Abschnitt „Studieneinstellung“ definiert.
Sehen Sie sich diese Abbildung an

Insgesamt wurden 68 Broschüren zur weiteren Lesbarkeit und Bewertung des Wortschatzes beigefügt. Bei der Bewertung der Broschüren auf ihre Eignung ergaben sich aus den Abrufergebnissen der Suchmaschine vier Kategorien: Grundlegende Informationen zur Krankheit (Psoriasis / Psoriasis-Arthritis, gekennzeichnet mit G1 / G2), allgemeine Hinweise zur Bewältigung von Psoriasis / Psoriasis-Arthritis in Situationen des täglichen Lebens (gekennzeichnet mit G3) / G4), einschließlich Themen wie Stress, Ernährung, Rauchen, Beruf und Reisen, Anleitung zu Medikamenten und Therapien (G5) und andere Themen (G6).

Beispielmerkmale

Während der Sammlung entstanden verschiedene Arten von Verlagen: Pharmaunternehmen oder -verbände, gemeinnützige Organisationen und öffentliche Einrichtungen. Von den 68 Broschüren wurden 71% (48/68) von Pharmaunternehmen oder -verbänden, 22% (15/68) von gemeinnützigen Organisationen und 7% (5/68) von öffentlichen Einrichtungen veröffentlicht. Eine detaillierte Auflistung in enthält den Titel, den Verlag und den Typ des deutschen Originaldokuments sowie das in G1-G6 getrennte Erscheinungsjahr.

Die enthaltenen Broschüren wurden hinsichtlich ihrer sprachlichen Merkmale analysiert. Die Anzahl der Sätze pro Broschüre lag zwischen 45 und 619 (Mittelwert 235; SD 147,40) und die Anzahl der Wörter zwischen 579 und 11,430 (Mittelwert 3852; SD 2542,58). Im Durchschnitt verwendeten die Autoren der Broschüre 16,4 Wörter, um einen Satz zu bilden (SD 3,03; Minimum = 11,5; Maximum = 27,7). Komplexe Wörter, die ≥3 Silben bedeuteten, lagen zwischen 253 und 4424 (Mittelwert 1284; SD 914,88). Der minimale Anteil komplexer Wörter betrug 22,85% (995/4354) und der maximale Anteil lag bei 46,9% (441/940), mit einem Mittelwert von 33,57% (1284/3852). Eine vollständige Auflistung mit Daten zur Anzahl der Sätze, Wörter, komplexen Wörter und Silben finden Sie pro Broschüre und Gruppe (G1-G6).

Lesbarkeitsanalyse

Alle Broschürengruppen (G1-G6) wurden gemäß den Lesbarkeitsmetriken FRE und WSTF analysiert, wie im Abschnitt Methoden beschrieben. Die Ergebnisse sind in dargestellt. Die meisten Broschüren sind schwierig (D) (FRE: 66%, 45/68; WSTF: 74%, 50/68) oder sehr schwierig (FRE: 34%, 23/68; WSTF: 13%, 9 / 68), um zu lesen.

In G1 war die Broschüre mit der niedrigsten Lesbarkeit PSO_110 mit einem FRE-Wert von 19,26 und dem zweithöchsten WSTF-Wert von 14,11 (VD). Die entsprechende Psoriasis-Arthritis-Gruppe G2 zeigte den niedrigsten FRE-Wert für PSO_210 mit FRE = 2,71 und WTSF = 15 (VD). Der dritte Dokumentensatz (G3) erzielte höhere FRE-Werte und signalisierte damit eine höhere Lesbarkeit, was durch niedrigere WSTF-Werte in dieser Gruppe unterstützt wird. Die entsprechende Psoriasis-Arthritis-Gruppe (G4) lieferte ähnliche Ergebnisse wie G1. Im Durchschnitt erzielten Dokumente über Medikamente gegen Psoriasis / Psoriasis-Arthritis oder Therapieempfehlungen (G5) die niedrigsten Werte, wobei PSO_502 das schwierigste in dieser Gruppe war (FRE = 8,36; WTSF = 15; VD). Die niedrigsten mittleren Lesbarkeitsniveaus waren FREG5= 23,50 und WSTFG5= 12,95. Die höchste Lesbarkeit wurde für G3 mit einem FRE von 41,39 und einem WSTF von 10,27 erreicht. Für G6 wurde kein Mittelwert berechnet, da die Stichprobengröße zu klein war. Mehrere ausgewählte Textfragmente mit niedriger oder hoher Lesbarkeit finden Sie in.

Die Verteilungen für beide Lesbarkeitsmetriken, FRE, und die Wiener Formel (WSTF) sind in und dargestellt.

.
Abbildung 3. Verteilung der erreichten Lesbarkeitswerte auf der Flesch Reading Ease-Skala. Die Schwierigkeit wird durch die Farbe angezeigt, wobei Dunkelgrün die höchste Lesbarkeit (90-100) und Dunkelrot die niedrigste Lesbarkeit (0-10) darstellt.
Sehen Sie sich diese Abbildung an
.
Abbildung 4. Verteilung der erreichten Lesbarkeitswerte auf der Wiener Formelskala. Die Schwierigkeit wird durch die Farbe angezeigt, wobei Dunkelgrün die höchste Lesbarkeit (4-5) und Dunkelrot die niedrigste Lesbarkeit (14-15) darstellt.
Sehen Sie sich diese Abbildung an

.

Tabelle 2.
                Auflistung der Lesbarkeits- und Vokabelnoten sowie der zugehörigen Klassenbezeichnungen.
Diese Tabelle anzeigen

Wortschatzklassifikation

Insgesamt hatten die Broschüren ein mittleres Vokabularmaß (L) von L = 3,66. Wie in aufgeführt, erreichten zwei Drittel der Unterrichtsmaterialien (69%; 47/68) eine Punktzahl von ≤4 (VE + E) und waren daher für ein Laienpublikum geeignet. Insgesamt 11/68 Broschüren (16%) hatten eine Punktzahl von ≥9 und sind daher nur für eine akademische Leserschaft geeignet. Für die verbleibenden zehn Broschüren (15%, 10/68) entspricht eine Punktzahl zwischen> 4 und <9 einem Niveau, das für Personen mit medizinischen Kenntnissen oder einem starken medizinischen Hintergrund geeignet ist. Die Gruppen G3 und G4 erzielten mit jeweils L = 1,75 das niedrigste Vokabular. The highest vocabulary measure was found for the booklet group on medication and therapy topics (G5), with L=6.64. The distribution of the classification results over all the brochure groups is depicted in .

.
Figure 5. Distribution of achieved vocabulary values on the SVM classification scale. Difficulty is indicated by color with dark green as the most laymen friendly (1) and dark red as the highest expert level required (10). SVM: support vector machine.
Sehen Sie sich diese Abbildung an

A comparison of the topic groups was conducted for the pairs G1/G3 and G2/G4. The results of the corresponding Wilcoxon test for two independent samples are presented in . Negative values originate from the definition of the FRE metric; that is, lower numbers correspond to a higher difficulty. In addition, due to a high number of ties (in the ranks) for the vocabulary metric (L), an exact computation of CI and P. was not possible. Instead, a normal approximation was used by the statistics software R.

.

Tisch 3.
                Comparison of different brochure groups for difficulty.
Diese Tabelle anzeigen

The observed differences between the brochure groups G1 and G3 (Psoriasis) for FRE (P.=.001), WSTF (P.=.003), and L (P.=.01) were statistically significant, as were the FRE (P.=.03), WSTF (P.=.03), and L (P.=.03) of G2 and G4 (Psoriatic Arthritis).

Diskussion

Principal Results

High-quality health information must not only include the best available external evidence, it must also be readable and reflect patients’ preferences []. In order to comply with these requirements, the application of easy language is essential [-,-,,].

The readability findings show that the majority of the collected material is difficult or very difficult (D+VD) to read, as shown by the WSTF (87%; 59/68). The outcome is more apparent when the German adaption of the FRE scale is applied (100%; 68/68) (). Thus, educational materials on Psoriasis/Psoriatic Arthritis are not suitable for their intended group of readers. This corresponds to the results of other authors, who also reported the high readability levels of such resources [-].

The vocabulary is also of great relevance for comprehensibility and might be even more decisive than the sentence structure []. The finding of the vocabulary analysis revealed that two-thirds (69%; 47/68) of the educational materials were well suited for laypeople. This originates from the fact that relatively few medical expert terms have been used during text production, or expert terminology has been actively avoided. With the difficulty assessment of 68 Psoriasis/Psoriatic Arthritis brochures, we demonstrated that a pretrained SVM can analyze text material for its vocabulary. The study findings therefore contribute the first dedicated vocabulary analysis related to the use of expert medical terms in patient educational material for Psoriasis and Psoriatic Arthritis.

Einschränkungen

Several limitations apply to the study setting. First, a public search engine was utilized to build the data collection used in this study. In this context, the internal mechanisms used to compute and retrieve information from a search engine’s index are not fully transparent. For this reason, some potentially relevant documents might have been missed by our data collection process. The retrieval was also limited to PDF documents. The study design included this file type as the corresponding documents are easily accessible in electronic format (machine-readable), can also be distributed in printed format (these documents are, in general, highly structured and proof-read by publishing institutions), and represent a robust, well-known data format to provide information on (chronic) diseases and related treatment options via the internet.

Second, for this study, we analyzed 68 brochures on Psoriasis/Psoriatic Arthritis published by different types of organizations (see ). Depending on the motivation of an organization, there might be different aims in terms of content, words used, and selected topics. This might have affected our results, as scientific organizations might have used more complex sentence structures to explain Psoriasis/Psoriatic Arthritis concepts, while pharmaceutical companies might tend towards easier vocabulary and sentence structure.

Next, in the preprocessing phase, the included PDF brochures were automatically converted to documents in DOCX format. Nevertheless, disturbance artifacts, that is, different kinds of hyphens or misencoded characters originating from different encoding schemes, may still have been included in the extracted, raw text material.

The adapted FRE metric and Vienna formula are mainly computed on the basis of mean sentence length, the mean number of syllables per word, and language-specific weighting factors. However, detecting syllables is not a trivial task for the German language and does not work reliably in some rare circumstances []. For this reason, the computed FRE or WSTF scores can be influenced by the aforementioned inaccuracies. In this context, it should be stressed that this affects all natural language processing analysis tools for German text material.

Furthermore, solely computing the readability of educational materials disregards the individual knowledge and motivation of readers []. Aspects related to illustration and design were not included in the analysis of this study. Consequently, the suitability of health information cannot exclusively be judged based on its readability or its used vocabulary [,]. In this context, the studies by Taylor-Clarke et al and Tuot et al [,], among others, have applied methods that go beyond measures of word and sentence lengths, such as the Suitability Assessment of Materials (SAM) instrument, which reflects other aspects of a brochure’s appearance that influence the understandability of (health) information and text comprehension.

However, besides the need for manual efforts, judging quality criteria is a highly subjective task for this instrument. Moreover, a sufficient number of judges are required to ensure an objective assessment of visual and aesthetic aspects in brochure design, which is not met by every study in this field. Even more important: interjudge reliability must be considered, evaluated, and reported properly. Modern approaches use crowd-sourcing techniques for which a large number of judges and related assessments can be obtained more easily [].

Comparison With Prior Work

Previous studies investigated the readability of health education materials on Psoriasis/Psoriatic Arthritis written in the English language [,]. In both analyses, the outcome was that the materials failed to “meet the desired 6th grade level” []. Although no accepted recommendation exists for German health education material, our findings confirm the low readability of Psoriasis/Psoriatic Arthritis brochures for patients. In contrast to the studies by Feldman et al and Smith, this study contributes the first vocabulary-related assessments of materials originating from the dermatology domain. We found that the vocabulary used in Psoriasis/Psoriatic Arthritis brochures is adequate for laypeople; that is, patients and family members who have no professional background in the health sector. A secondary study outcome gives a broad picture over the published materials in German-speaking countries, listed by publisher and year in .

In a previous study [], Keinki et al analyzed information booklets for German cancer patients. In this particular domain, the authors found a mean vocabulary score of LSVM=5.09, signaling a higher difficulty for laypeople than in this study (LSVM=3.66), that is, Psoriasis/Psoriatic Arthritis brochures make use of less complex medical terminology. This difference might be explained by the fact that Psoriasis/Psoriatic Arthritis brochures are mainly (71%; 48/68) produced and published by pharmaceutical companies or related associations. In contrast, cancer booklets follow a stricter evidence-based text production process in Germany [], that is, patient guidelines and brochures on cancer topics are written or reviewed by medical professionals.

Future Directions

This study analyzed static PDF document content for Psoriasis/Psoriatic Arthritis patients. In future work, the authors intend to extend their analyses to other types of online resources. This includes the content of trustworthy health information websites in German or articles in Wikipedia. Given such an analysis, a comparison to the work of Thomas et al [] would be possible in terms of FRE and grade levels, as the authors reported even lower readability than in this study.

Schlussfolgerungen

For 68 German Psoriasis and Psoriatic Arthritis brochures freely available on the internet, the study findings reveal that the readability is low ( and ). Publishing organizations and authors should, therefore, reevaluate existing brochures and reduce sentence complexity, but our findings suggest that the use of vocabulary suits the target audience ().

Methods from the field of machine learning can support authors of Psoriasis/Psoriatic Arthritis brochures, as they complement existing readability assessment methodology. For this reason, the assessment of written patient information should preferably be analyzed in terms of sentence structure and vocabulary, such as via the SVM-based classifier used for this study. The authors recommend the use of both sentence dimension and vocabulary dimension as supportive measures to ensure and provide understandable health education materials, independent of the medical domain.

The authors thank Psoriasis Netz (psoriasis-netz.de) for hosting a well-maintained, curated collection of Psoriasis/Psoriatic Arthritis brochures on their website.

Keine deklariert.

Hrsg. Von G Eysenbach; submitted 02.09.19; peer-reviewed by J Papadakos, J Lander; comments to author 09.11.19; revised version received 17.12.19; accepted 19.12.19; published 11.03.20

©Martin Wiesner, Richard Zowalla, Monika Pobiruchin. Originally published in JMIR Dermatology (http://derma.jmir.org), 11.03.2020.

Dies ist ein Open-Access-Artikel, der unter den Bedingungen der Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0/) verbreitet wird und die uneingeschränkte Verwendung, Verbreitung und Reproduktion in jedem Medium ermöglicht, sofern das Original vorliegt Arbeiten, die erstmals in JMIR Dermatology Research veröffentlicht wurden, werden ordnungsgemäß zitiert. Die vollständigen bibliografischen Informationen, ein Link zur Originalveröffentlichung auf http://derma.jmir.org sowie diese Copyright- und Lizenzinformationen müssen enthalten sein.

Der Original-Artikel erschien unter der Creative-Commons-Lizenz CC BY 4.0.

Gib den ersten Kommentar ab

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Mission News Theme von Compete Themes.