Coder Social home page Coder Social logo

tibhannover / pica-kulatur Goto Github PK

View Code? Open in Web Editor NEW
2.0 3.0 0.0 7.7 MB

Aus WinIBW-Downloads von PICA-Daten mehrfach vorhandene Exemplare herausfiltern (z.B. zur Makulatur alter Dubletten). Vormalig verantwortlich: @katrinleinweber

License: GNU Affero General Public License v3.0

Shell 100.00%
winibw pica bibliothekskatalog library-catalogue code4lib library-automation

pica-kulatur's Introduction

PICA-kulatur Project Status: Inactive – The project has reached a stable, usable state but is no longer being actively developed; support/maintenance will be provided as time allows.

Aus WinIBW-Downloads von PICA-Daten mehrfach vorhandene Exemplare herausfiltern (z.B. zur Makulatur alter, physikalischer Dubletten).

Installation

Dieses Bash-Skript wurde bisher im Terminal von macOS 10.13.6 mit der Z Shell (v5.7.1) getestet. In der regulären Bash oder der Git Bash für Windows funktioniert es leider momentan nicht (siehe #5). Daher:

  1. macOS-Terminal in seinen Optionen auf /bin/zsh umstellen und neu starten.
  2. git clone https://github.com/katrinleinweber/PICA-kulatur ausführen.
  3. Mit cd PICA-kulatur in ebenjenes neues Verzeichnis wechseln.
  4. Das Skript mit chmod +x PICA-kulatur.sh ausführbar machen.

Benutzung

  1. In den WinIBW-Einstellungen-/Optionen prüfen, wohin Downloads/Exporte gespeichert werden.
  2. Evtl. vorhandene Dateien (z.B. download.txt) umbenennen oder löschen.
  3. In WinIBW das "Set" angelegen, das nach mehrfach vorhandenen Exemplaren durchsucht werden soll.
  4. Das Set mit dem dow-Befehl in die oben ermittelte Datei herunterladen.
  5. Jene Datei ins PICA-kulatur-Verzeichnis kopieren.
  6. Terminal dort aufrufen.
  7. ./PICA-kulatur.sh download-test.txt (bzw. den jeweiligen Dateinamen des Downloads/Exports) eintippen & mit der Enter-/Return-Taste bestätigen.

Die in diese Repository beigelegte Test-Datei demonstriert die Nutzung. Sie enthält folgende Datensätze:

  • PPN 01848350X mit 12 Exemplaren,
  • 1013878469 mit zweien,
  • 130994197 mit einem, sowie
  • 59975818X mit mehreren, allerdings schon makulierten Exemplaren.

Ausgabe

Die vermutlich mehrfach vorhanden Exemplare werden:

  • nach PPN aufgelistet in EVTL-makulierbar/...txt mit der gezählten Anzahl, sowie
  • in einer Zeit-gestempelten ...zip-Datei gesichert.

Bitte prüfen, ob sie wirklich makuliert werden können.

pica-kulatur's People

Contributors

katrinleinweber avatar

Stargazers

 avatar  avatar

Watchers

 avatar  avatar  avatar

pica-kulatur's Issues

Auch Titel in die Ergebnisdatei schreiben?

Wäre dies nützlicher als die PPN? Oder nützlicher in Kombination mit ihr?

Müsste durch Einbau von:

TITEL=$(grep -Eom 1 '021A  .*$' $PICA_D \
	| sed -E 's/021A +//g' \
	| sed -E 's/ +/-/g'
	)

in die for-Schleife funktionieren.

Temporäre Dateien zu "N-PPN.txt" umbenennen?

Unklar, ob dies neben der Ergebnisdatei nötig ist. Vielleicht zum prüfen der Makulierbarkeit, ohne die PPN in WinIBW kopieren-und-einfügen zu müssen? Falls ja, könnte es wie #1 in der for-Schleife eingebaut werden, als:

mv $PICA_D $EX_N-$PPN.txt

So könnten auch im Dateibrowser die häufigsten Exemplare untersucht werden.

Oder: PPN oder TITEL an den Anfang, damit nicht nach Zahl der Exemplare sortiert würde?

Wo/Wie die Ergebnisse am Besten darstellen?

  • Kommandozeile? Divergenz wegen ^^^...vvv-Notiz & Sortierung der Liste => wenn zu viele, scrollt die Ansicht runter zu den wenigsten Dubletten
  • Ergebnisdatei? TXT, CSV, etc.?
    • wenn CSV: Excel-kompatibel?
  • temporäre TXTs behalten oder gar .zipen?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.