friederikebauer commited on
Commit
7837e22
·
verified ·
1 Parent(s): 5b226d0

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +32 -7
README.md CHANGED
@@ -30,13 +30,16 @@ Es benutzt dabei ein regelbasiertes Modell (basierend auf patterns, siehe [spacy
30
  ### Taxonomie und Patterns
31
 
32
  Basis für das Modell sind Patterns die für das Modell händisch generiert wurden. Die Taxonomie „Keywords Frauenerwerbstätigkeit“ umfasst Konzepte, die Angebote und Anforderungen an Arbeitnehmer:innen in Stellenausschreibungen beschreiben.
33
- Sie hat drei Ebenen, wobei die letzte Ebene zur Klassifizierung verwendet wird. Die erste Ebene umfasst 'Anforderungen an BewerberIn', 'Angebote an BewerberIn' und 'Weitere Konzepte'.
34
- Auf der zweiten Ebene werden die Angebote und Anforderungen weiter beschrieben, z.B. familienfreundliche Konzepte vs. Konzepte zur zeitlichen Unabhängigkeit. Die Klassifikation wird auf der untersten Ebene durchgeführt. Die Konzepte sind unterschiedlich oft vertreten. Es gibt insgesamt 16 Konzepte auf der untersten Ebene.
 
 
 
35
 
36
  - Anforderungen an Bewerber:innen
37
 
38
  - Anforderungen an Arbeitsort
39
- - Präsenzpflicht
40
  - Räumliche Flexibilität
41
  - Zeitliche
42
  - Zeitliche Flexibilität
@@ -47,7 +50,7 @@ Auf der zweiten Ebene werden die Angebote und Anforderungen weiter beschrieben,
47
  - Angebote an Bewerber:innen
48
  - Zeitsouveränität
49
  - Planbarkeit und Verlässlichkeit
50
- - Flexible und gestaltbare Dienstpläne und Schichtmodelle
51
  - flexible und gestaltbare Arbeitszeiten
52
  - Wahl des Arbeitszeitumfangs
53
  - Job-Sharing
@@ -55,9 +58,11 @@ Auf der zweiten Ebene werden die Angebote und Anforderungen weiter beschrieben,
55
  - Vereinbarkeit
56
  - Unterstützung bei der Kinderbetreuung
57
  - wohnortnahe Einsätze
58
- - Finanzielle Unterstützung
59
  - Familiäre und anlassbezogene Freistellung
60
- - Unterstützung bei der Pflegeverantwortung
 
 
61
 
62
  ## Klassifikations-Prozess
63
 
@@ -65,7 +70,9 @@ Die Stellenausschreibungen wurden anhand von erstellten spacy-patterns nach ihre
65
 
66
  ## Benutzung des Modells
67
 
68
- Das Modell kann auf Texten angewendet werden die Stellenausschreibungen enthalten oder einen ähnlichen Inhalt wie Stellenausschreibungen enthalten. Das Modell gibt für jedes gefundene Konzept die Posting id (die id der Stellenausschreibung) und das gefundene Konzept zurück. Es kann daher mehrere Zeilen für ein Posting (eine Stellenausschreibung) geben.
 
 
69
 
70
  Um die Pipeline effizienter laufen zu lassen wurden ungebrauchte Elemente disabled. Es wurde zudem ein Qualitäts-check für 2.000 Stellen durchgeführt um dies zu testen.
71
 
@@ -124,6 +131,7 @@ Disagreements bei der Annotation wurden folgenderweise aufgelöst: Von ursprüng
124
  ## Evaluation
125
 
126
  Das Modell wird mit folgenden Metriken evaluiert: Precision, Recall und F1-Score. In einem Dokument können mehrere Konzepte auftauchen oder kein Konzept.
 
127
 
128
  ### Testdaten (Goldstandard)
129
 
@@ -132,6 +140,9 @@ Das Modell wird mit folgenden Metriken evaluiert: Precision, Recall und F1-Score
132
  | Klassifikation (Micro) | 624 | 0,94 | 0,689 | 0,796 |
133
  | Klassifikaation (Macro) | 624 | 0,8 | 0,54 | 0,62 |
134
 
 
 
 
135
  | | Konzept | N | p | r |
136
  | :----------------------------- | :------------------------------------------------------ | --: | ---: | ---: |
137
  | Angebote an Bewerber:innen | Familiäre und anlassbezogene Freistellung | 8 | 1,0 | 0,88 |
@@ -150,3 +161,17 @@ Das Modell wird mit folgenden Metriken evaluiert: Precision, Recall und F1-Score
150
  | | Zeitliche Flexibilität | 31 | 1,0 | 0,32 |
151
  | | Schichtdienst | 83 | 0,98 | 0,76 |
152
  | | Flexibilität (SK) | 82 | 0,85 | 0,83 |
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
30
  ### Taxonomie und Patterns
31
 
32
  Basis für das Modell sind Patterns die für das Modell händisch generiert wurden. Die Taxonomie „Keywords Frauenerwerbstätigkeit“ umfasst Konzepte, die Angebote und Anforderungen an Arbeitnehmer:innen in Stellenausschreibungen beschreiben.
33
+ Sie hat drei Ebenen, wobei die letzte Ebene zur Klassifizierung verwendet wird.
34
+ Die erste Ebene umfasst 'Anforderungen an BewerberIn', 'Angebote an BewerberIn' und 'Weitere Konzepte'.
35
+ Auf der zweiten Ebene werden die Angebote und Anforderungen weiter beschrieben, z.B. familienfreundliche Konzepte vs. Konzepte zur zeitlichen Unabhängigkeit.
36
+ Die Klassifikation wird auf der untersten Ebene durchgeführt.
37
+ Die Konzepte sind unterschiedlich oft vertreten. Es gibt insgesamt 16 (*12) Konzepte auf der untersten Ebene.
38
 
39
  - Anforderungen an Bewerber:innen
40
 
41
  - Anforderungen an Arbeitsort
42
+ - Präsenzpflicht*
43
  - Räumliche Flexibilität
44
  - Zeitliche
45
  - Zeitliche Flexibilität
 
50
  - Angebote an Bewerber:innen
51
  - Zeitsouveränität
52
  - Planbarkeit und Verlässlichkeit
53
+ - Flexible und gestaltbare Dienstpläne und Schichtmodelle*
54
  - flexible und gestaltbare Arbeitszeiten
55
  - Wahl des Arbeitszeitumfangs
56
  - Job-Sharing
 
58
  - Vereinbarkeit
59
  - Unterstützung bei der Kinderbetreuung
60
  - wohnortnahe Einsätze
61
+ - Finanzielle Unterstützung*
62
  - Familiäre und anlassbezogene Freistellung
63
+ - Unterstützung bei der Pflegeverantwortung*
64
+
65
+ *nachträglich entfernt
66
 
67
  ## Klassifikations-Prozess
68
 
 
70
 
71
  ## Benutzung des Modells
72
 
73
+ Das Modell kann auf Texten angewendet werden die Stellenausschreibungen enthalten oder einen ähnlichen Inhalt wie Stellenausschreibungen enthalten.
74
+ Das Modell gibt für jedes gefundene Konzept die Posting id (die id der Stellenausschreibung) und das gefundene Konzept zurück.
75
+ Es kann daher mehrere Zeilen für ein Posting (eine Stellenausschreibung) geben.
76
 
77
  Um die Pipeline effizienter laufen zu lassen wurden ungebrauchte Elemente disabled. Es wurde zudem ein Qualitäts-check für 2.000 Stellen durchgeführt um dies zu testen.
78
 
 
131
  ## Evaluation
132
 
133
  Das Modell wird mit folgenden Metriken evaluiert: Precision, Recall und F1-Score. In einem Dokument können mehrere Konzepte auftauchen oder kein Konzept.
134
+ Die Evaluation wurde auch
135
 
136
  ### Testdaten (Goldstandard)
137
 
 
140
  | Klassifikation (Micro) | 624 | 0,94 | 0,689 | 0,796 |
141
  | Klassifikaation (Macro) | 624 | 0,8 | 0,54 | 0,62 |
142
 
143
+
144
+
145
+
146
  | | Konzept | N | p | r |
147
  | :----------------------------- | :------------------------------------------------------ | --: | ---: | ---: |
148
  | Angebote an Bewerber:innen | Familiäre und anlassbezogene Freistellung | 8 | 1,0 | 0,88 |
 
161
  | | Zeitliche Flexibilität | 31 | 1,0 | 0,32 |
162
  | | Schichtdienst | 83 | 0,98 | 0,76 |
163
  | | Flexibilität (SK) | 82 | 0,85 | 0,83 |
164
+
165
+
166
+ Das Modell wurde nachträglich nochmal angepasst und folgende Konzepte entfernt:
167
+ - Präsenzpflicht
168
+ - Unterstützung bei der Pflegeverantwortung
169
+ - Finanzielle Unterstützung
170
+ - Flexible und gestaltbare Dienstpl��ne und Schichtmodelle
171
+
172
+ Dadurch ergibt sich folgende aktualisierte Evaluation:
173
+
174
+ | Task | N | Precision | Recall | F1 |
175
+ | :---------------------- | --: | --------: | -----: | ----: |
176
+ | Klassifikation (Micro) | 624 | 0,94 | 0,7 | 0,81 |
177
+ | Klassifikaation (Macro) | 624 | 0,96 | 0,67 | 0,76 |