bundestag / gesetze Goto Github PK

Bundesgesetze und -verordnungen

Home Page: http://bundestag.github.io/gesetze/

License: The Unlicense

gesetze's Introduction

bundestag

Data and code for the visualization of the voting pattern of the German parliament

preprocessing.R takes the data downloaded from bundestag.de and preprocesses them in the the following three data files:

Data_persons.RDS, a 139 (bills) x 659 (members of parliament) table
Data_vote.X.person.RDS and, a 659 (members of parliament) x 3 (given name, surname, party) table
Data_votes.RDS, a a 139 (bills) x 4 (data file, title of bill, date voted, days from day 1) table

analysis.R uses these three data files to produce all figures shown in the post here: http://jmbh.github.io/Analyzing-voting-pattern-of-German-parliament/

bundestag_aux_functions.R is sourced by analysis.R and contains functions used in analysis.R.

gesetze's People

Contributors

Stargazers

Watchers

Forkers

bundesregierung digiges nikosch eins78 nvdnkpr jaseg jedahan zsiec shapeshed real-mielofon djon3s senyai louaybassbouss usercontrol io41 sleeper2 vingrad shaowenhuang posthttp brtrbr circlefanduck rspielmann ibobriakov andrewmallis cordoval janl samv hzssean zhuixinjian koos philipp-kempgen opendatahackday arodrig0 etiennepierrot baik rriemann caymanson huluvu424242 manesh kissgoodbye colordungt5 mrrio zmqgithub j12i matthiasfromm levinalex pourasghar christianmasannek mario-mendoza-sedeno lokaler alininja thomas-boesgaard svewag piratenpartei bwoester mickael-bertrand tobislaw juyide burningtyger ilin-in erikstein gryzzly dymat abta ddie marc0902 terjetyl makotosi holgerd77 mathiasschindler rotespferd jtremback aseyboldt jocelyndelalande earlyclues ergoon webflo wilkic ivbeg vermeleon gusaaaaa pithyless loleg sirex hypertexthero makasim aliraza-ui renemeye it-ony bwaltl adrelanos mcgrummel hypest heinrichhartmann nobutamura alnkpa bocachica shuaihm national-laws weiland

gesetze's Issues

Umwandlung von Tabellen ist fehlerhaft

Bei Tabellen zB in §§ 19,22 EStG ist Markdown und Html Version praktisch immer falsch.
Wahrscheinlich kann man die Stellen automatisch finden, wenn man in den Markdown-Versionen nach zwei Sternchen ( * ) nebeneinander sucht.

Auch für andere Bugs ist die Suche nach leerstehenden Sternchen möglich, z.B. die Umwandlung von fremdsprachlichen Begriffen in der Anlage 2 EStG, die auch nicht funktioniert.

Bei Markdown Konvertierung "code blocks" deaktivieren

Bei manchen Unterpunkten wird trotz korrektem .md File ein fehlerhafter .html File erzeugt, weil -wegen der Einrückung- die Konvertierung .md -> html die Stelle als code-block formatiert, z.B. bei § 11 Abs. 1 Nr. 1 a StGB.

Am besten man schaltet dieses code-block Feature bei der Markdown-Konvertierung komplett ab.

Zeitpunkt des Inkrafttretens von neueren Gesetzen fehlt

Bei neueren Gesetzen (Beispiel: http://www.gesetze-im-internet.de/agg/BJNR189710006.html) erscheint im Original der Zeitpunkt des Inkrafttretens meist als einleitender Satz. Im Markdown ist es nicht enthalten; es darf aber nicht fehlen, weil es eine wichtige Information ist. (Wegen Art. 82 II 2 GG)

Entferne Satzzahlen im Text

Per Mail: "Bei den juris-Gesetzen gibt es eine kleine Inkonsistenz, die folglich auch bei Github auftaucht: Bei manchen Gesetzen erscheinen die Satzzahlen im Text und folglich auch im Markdown und sind dort beim Lesen etwas störend."

Add Continuous Integration support

CI is awesome, but how to test laws? Some ideas:

Law Integrity: do all referenced laws exist? Is the referenced paragraph still existant?
Law Content Linting: should a paragraph be split into two, is it too complex by some language measure?
Law Style Linting: Proper line breaks in Markdown etc.

Having TravisCI test law change proposals would be mind-boggingly sweet.

Struktur der Daten, Schemadateien, Pflegemodell?

Es ist schon erstaunlich, welcher Hype um dieses Repository entfacht wurde... Respekt fürs Medien-Manöver!
Ich bekomme graue Haare, wenn ich sehe, dass hier Studenten vom HPI am Werke sind, die den Unterschied zwischen unstrukturierten, semi-strukturierten und strukturierten Daten kennen sollten und eigentlich auch in der Lage sein sollten, erst entsprechende Strukturen (!) zu entwickeln und dann Datenformate dafür auszuwählen.

Wohin soll Euch bitte "Markdown", welches ein Schreibformat für Webmenschen ist, als Datenformat tragen?
Meiner Ansicht nach kommt ihr bei juristischen Daten nicht um XML rum. Das wurde von Charles F. Goldfarb doch gerade entwickelt, um Datenstellen in juristischen Texten zu markieren und maschinenlesbar zu sein. Semi-strukturierte Datenformate wie "Markdown" oder auch "HTML" sind nicht gut geeignet für juristische Daten, weil sie zu wenig Strukturinformation offenbaren - höchstens für eine menschenlesbare Repräsentation der Daten.

Bei strukturierten Daten gibts regelmäßig zusätzlich zu den Daten noch ein Schema-Format, um Kenntnis über die Struktur zu haben und Format-Validierungen zu ermöglichen (XML/XSD/DTD).

Es lässt sich in diesem Repository an Struktur nicht wirklich viel finden, nämlich lediglich
(a) der alphabetischen Repo-Index und
(b) einige Zeilen in jedem Gesetzes-Dateikopf (Ausfertigungsdatum, Fundstelle, Neugefasst durch, Zuletzt geändert durch), sowie
(c) einige Markdown-Tags, etwa "Doppelhash Absatz/Überschrift".
Insgesamt weniger, als auf den seit Jahren gut gepflegten Platformen http://buzer.de, http://openjur.de, http://juris.de/ oder http://gesetze-im-internet.de. Ich kann bislang keine Neuerungen oder Verbesserungen erkennen.

Zudem ist es grotesk, dass bereits bestehende und etablierte XML-Gesetzesstandards des BMJ und der Verwaltung gänzlich ignoriert werden. Ich denke, ihr wollt Euch in den bestehenden Toolchain einklinken und die Arbeit damit verbessern - dann macht das doch einfach mal! Werft mal einen Blick in die UML Spezifikation von xNorm und eNorm. Das Verfahren läuft mit diesen Werkzeugen und nicht mit Git oder auf Github :)

Wir halten fest:
Die Struktur der Daten ist schwach. Es gibt keine Schemadateien. Es gibt kein Pflegemodell.

Strukturinfo für Einarbeiten Gesetzesinfo?

Bei bayerischen Gesetzen steht in der .html Fassung noch Strukturinfo ala (siehe http://tinyurl.com/cxkb8ac). Für das Einarbeiten neuer Gesetzesentwürfe + Prüfen auf Fehler erscheint mir das für menschliche Bearbeiter sehr praktisch, um die Veränderungen schnell zuordnen zu können. Im Markdown-Text selbst würde das aber wahrscheinlich die Lesbarkeit verringern. Vielleicht bräuchte man noch einen Markdown-Converter in ein Zwischenformat?

Letztlich gibt es in Gesetzen an Struktur ja nur: § 1 Abs. 1 Satz 1 Nr. 1 a) aa)... Hin und wieder leider unregelmäßiges Zeug wie Spiegelstriche.

Letzter Commit vor 3 Jahren

Finde ich sehr schade, dass das Repo nicht mehr verwaltet wird…

Obermenge von #54

LkSG ab Januar 2023 in Kraft getreten; aktuelle Version im Repository daher nun unvollständig

aktuelle Version zu finden unter https://www.gesetze-im-internet.de/lksg/index.html

Formatierung von Aufzählungen fehlerhaft

Teilweise ist die Formatierung von Aufzählungen fehlerhaft.

Beispiel: StVO § 3:

(3) Die zulässige Höchstgeschwindigkeit beträgt auch unter günstigsten
Umständen

- innerhalb geschlossener Ortschaften für alle Kraftfahrzeuge
- 50 km/h,
- außerhalb geschlossener Ortschaften
- a)
- für Kraftfahrzeuge mit einem zulässigen Gesamtgewicht über 3,5 t bis
  7,5 t, ausgenommen Personenkraftwagen, für Personenkraftwagen mit
  Anhänger, für Lastkraftwagen und Wohnmobile jeweils bis zu einem
  zulässigen Gesamtgewicht von 3,5 t mit Anhänger sowie für
  Kraftomnibusse, auch mit Gepäckanhänger
- 80 km/h,

Besser:

Ebene 1
1. Ebene 2
  1. Ebene 3
  2. Ebene 3
    1. Ebene 4
Ebene 1

Dies könnte allerdings bedeuten, dass aus 1.b.1. im Original ein 1.ii.a. in Markdown wird.

Projekt noch aktiv?

Hallo, ist das Projekt noch aktiv? Wenn nein, wäre ein Hinweis in der README sehr praktisch. Und gibt es Alternativen? Ich finde das Projekt sehr gut, aber der letzte Commit ist von 2013.

proper documentation on markdown encoding

Do you have any documentation about the proper use of markdown to preserve the law structure?

Bitte Logo prüfen

Andere kommen vielleicht auf dumme Gedanken, wenn sie den Bundesadler und die OctoCat so sehen. Bitte aufpassen!

http://de.wikipedia.org/wiki/Verunglimpfung_des_Staates_und_seiner_Symbole

"Strafbar sein können beispielsweise [...] Verunstaltungen des Bundesadlers"

Aktualität

Hi,

wie sieht es denn mit der Aktualität dieser Sammlung aus? Ich sehe, daß die letzten Änderungen vor einem Jahr eingepflegt wurden ... in der Zwischenzeit hat sich doch Einiges geändert und ist hinzugekommen? Wir diese Gesetzesquelle nicht mehr gepflegt ? Wer ist der Zuständige Ansprechpartner ?

Ungebräuchliche Abkürzungen für Gesetze

Manchmal sind die Abkürzungen für Gesetzesbezeichnungen bei Gesetze-im-Internet falsch bzw. in der Praxis völlig ungebräuchlich. Komischerweise machen sie es in der HTML-Fassung in der Überschrift meistens richtig.
Es wäre praktisch, wenn es eine Liste aller Gesetze gäbe, die man dann wie ein Wiki nach und nach anpasst...

Derzeitige Beispiele:

~~KredWG~~ KWG
~~BGBEG~~ EGBGB
~~BBauG~~ BauGB

Update: Der Fundstellennachweis A des Bundesjustizministeriums erhält ab S. 763 ein Abkürzungsverzeichnis. (http://www.bgbl.de/Xaver/start.xav?startbk=Bundesanzeiger_BGBl)

Vielleicht wäre es auch praktisch, die Gliederungsnummern aus dem Fundstellennachweis als Metadata in die Gesetze aufzunehmen.

Hintergrundinfo in der Readme

ich denke, es wäre gut, in der Readme kurz darauf einzugehen, wer/welche Organisation hinter diesem Projekt steht.

URL zu GitHub Pages Seite inzwischen tot

Der Link auf der Hauptseite des Projekts zu http://bundestag.github.com/gesetze/ funktioniert inzwischen nicht mehr, da GitHub die Pagesseiten auf eine eigene Domain verschoben hat. Die URL sollte mit https://bundestag.github.io/gesetze/ ersetzt werden.

Inhalte der gesetze-im-internet Seiten unvollstaendig

unter gesetze-im-internet findet sich ein fast leeres AAGB
im Bundesanzeiger findet sich der vollstaendige Text

Dies ist leider nur eins von mehreren Beispielen. Evtl. muessen hier noch mehrere vertrauenswuerdige Quellen hinzugefuegt werden.

Gesetze mit Graphiken

Es gibt ein paar wenige Verordnungen, die sehr bilderlastig sind. Vielleicht sollte man die identifizieren und dann dort auf eine Markdown-Fassung verzichten und es gleich in HTML schreiben, weil Markdown da eh nicht viel Sinn ergeben kann?
Ein Beispiel: http://www.gesetze-im-internet.de/binschstro_2012/index.html

Probleme mit Fußnoten bzw. Sonderzeichen *

Leider sind die Gesetze-Im-Internet Fußnoten nicht standardisiert, das führt immer mal wieder zu fehlerhaftem Markdown und dann .html Output, siehe zB § 9 InsO.

Vielleicht kann man solche Probleme automatisch mittels Regex im Markdown finden: Es kann ja nur sehr wenige zulässige Fehler von mehreren Sonderzeichen hintereinander im Markdown geben, mir fällt jetzt nur § oder # ein, alles andere ist dann sehr wahrscheinlich problematisch.

Markdown-Dialekt festlegen

Das Markup-Format der Gesetzestexte im Repository ist bisher nur als "Markdown" spezifiziert, obwohl es einige Markdown-Dialekte gibt. Neben John Gruber's originalem Standard Markdown (SM), und dem erwähnten Pandoc Markdown fällt mir noch Multimarkdown ein und die index.md-Dateien werden hier mit GitHub-Flavoured Markdown (GFM) interpretiert. Die englische Wikipedia hat eine Liste der Markdown-Implementationen.

GFM erweitert SM im Wesentlichen um für GitHub-spezifische Dinge wie automatisches Linken von Commits/Issues/Personen und fügt Code-Blöcke hinzu. Ich denke, dass die Unterschiede zwischen GFM und SM vernachlässigbar sind. Über den kleinen Unterschied beim Umgang mit Leeraum sollte man aber vielleicht noch mal nachdenken.

SM wie GFM kennen keine Syntax für Tabellen. Sollten solche benötigt werden, wäre es vielleicht besser, sich auf Pandoc-Markdown oder Multimarkdown festzulegen. Für die weitere Verarbeitung von SM/GFM Quellen mit Inline-HTML müssten diese sonst erst komplett zu HTML und anschließend zum eigentlichen Zielformat konvertiert werden. Mit Pandoc z.B. ist das kein Problem, aber vielleicht für andere Szenarien.

Erweitern um Landesrecht

Wie wäre es, wenn weitere Crawler für die jeweiligen Landesrecht- Seiten hinzukämen?

I created a new repo to download and transform all DE federal laws to structured JSON

Hi all,

Since this repo had limited updates, I created two Python scripts that allow you to independently download all laws as XML and process them to JSON. Hope it might be helpful to others!

https://github.com/maxsagt/de_laws_to_json

Cheers

Präsentation der Jekyll-Version überarbeiten.

Der gh-pages-Branch dieses Repositories enthält schon grundlegende Konfiguration, um die Markdown Repräsentationen in HTML umzuwandeln. Es fehlt aber noch ein zumindest grundlegendes Design in CSS und vielleicht auch etwas die Navigation unterstützendes Javascript.

Siehe auch: Statement vom Projektautor zum Thema.

Bitte beachten: #19 hängt hier von ab.

New standard LegalDocML.de

See LegalDocML.de standard.

Unfortunately, laws are not yet published in this format.

Non-Textual Content

Mir fallen folgende Inhalte auf, z.B.:

Inhalt: nicht erfaßtes Grunderwerbsverzeichnis, Fundstelle: Anlageband II zum BGBl. I Nr. 22 vom 19.4.1994 I 734, S. 231 - 280
Inhalt: nicht erfaßter Erläuterungsbericht mit nicht darstellbaren Graphiken und Plänen, Fundstelle: Anlageband III zum BGBl. I Nr. 22 vom 19.4.1994 I 734, S. 283 - 378

Währe es technisch möglich, diese Inhalte entweder direkt (inline Grafik) darzustellen oder zumindest zu verlinken?

Link auf gh-pages an prominenter Stelle

http://bundestag.github.com/gesetze/ sollte im Repository als Website verlinkt werden.

Dokumentation der Struktur

Die Struktur des Repos sollte besser dokumentiert werden.
Augenscheinlich gibt es für jeden Buchstaben einen Ordner (um die Anzahl der jeweiligen Unterordner klein zu halten(?)) und darin pro Gesetz einen Ordner benannt nach dem Kurznamen des Gesetzes (?) und darin eine index.md.
Ist das so korrekt? Was sind die Gründe für diese Struktur?

Was ist das eigentliche Endprodukt / wie ist die Nutzung des Repos gedacht / welche Use-Cases gibt es?
Klickt man sich auf https://github.com/bundestag/gesetze durch?
Öffnet man das Repo lokal in gitk/gitx/tortoise?
Sollte es einen STRG-F-durchsuchbaren Index mit den ausgeschriebenen Namen geben? Wie wird dieser generiert?

github pages/mobile html5 app

Please use something like http://middlemanapp.com/ to dump the laws in a static (mobile aware) web page, which should be hosted on http://bundestag.github.com . Javascript search would be awesome as well. Next step would be to export the webpage (with jquery-mobile) to mobile app markets!

Maybe we can create a dedicated working group. I would be in!

Verweise als Hyperlinks

Es wäre schön, wenn Verweise zu anderen Gesetzen als Hyperlinks ausgeführt würden!

Formatierungsfehler bullet points in html (Beispiel: § 46 II StGB)

In der .html Version von § 46 Absatz 2 StGB wird für das erste Unterelement des Absatzes ein überflüssiger bullet point erzeugt. Wahrscheinlich weil im Original ausnahmsweise mehrere Unterpunkte nur durch Einrückung, nicht durch Gedankenstriche (-) angeführt sind.

Nehmt doch MultiMarkdown für LaTeX Konvertierung

Wenn ihr MultiMarkdown verwendet, könnt ihr die Gesetzestexte auch wunderbar in LaTeX konvertieren. soweit ich das noch weiss, hat MultiMarkdown eine direkte Möglichekit in Texte in LaTeX zu wandeln. MultiMarkdown ist eine tolle Erweiterung von Markdown und lässt sich in verschiedenste TExt-Dokuemnte konvertieren:

Mehr Infos gibt es hier:

http://fletcherpenney.net/multimarkdown/features/
https://github.com/fletcher/peg-multimarkdown-latex-support

Entwicklungssprache festlegen

Es ist nicht klar, ob in Deutsch, oder Englisch entwickelt und diskutiert werden soll.

Das momentane Durcheinander setzt Kenntnis beider Sprachen allein zum Entwickeln voraus, was die denkbar schlechteste Lösung ist.
Ebenso würde Englisch zum Entwickeln und die deutschen Gesetzestexte zwei Sprachen für eine inhaltliche Diskussion voraussetzen.

Wegen der Notwendigkeit, mit deutschen Gesetzestexten umzugehen, halte ich daher für am sinnvollsten, die Deutsch als Sprache für die Entwicklung festzulegen.

Trinkwasserverornung nicht aktuell

siehe
http://www.dvgw.de/wasser/recht-trinkwasserverordnung/trinkwasserverordnung/