Coder Social home page Coder Social logo

lexml-dou's Issues

Mapeamentos semânticos, registrar

O LexML desde o princípio, através dos vocabulários, vem fazendo uso direto ou indireto de RDF. Ao adotarmos Schema.org, por ser parte do "ecossistema RDF", não haveria descolamento das convenções já adotadas, mas há que se demonstrar isso através do mapeamento.

Exemplos do XML LexML e URN LEX,

  • Epígrafe foi estabelecida como dc:title do documento normativo.
  • Ementa foi estabelecida como dc:description do documento normativo.
  • ...

Onde dc: é o DC-terms, http://purl.org/dc/elements/1.1/
O mesmo foi utilizado como fonte de equivalência nos derivados de CreativeWork,

  • dc:title é sc:name, o que se confirma pelo alinhamento ontológico feito na Wikidata, title P1476 e outras fontes... o name é uma generalização de title que tem semântica equivalente quando submetido ao mesmo escopo (no caso CreativeWork).

  • dc:description é sinônimo de sc:description pela própria definição, que explicitou <link property="owl:equivalentProperty" href="http://purl.org/dc/terms/description"/> na definição schema_org_rdfa.html (ver código-fonte).

Estabelecer critério de máxima granularidade na marcação semântica

Por exemplo um nome pode ser marcado simplesmente com name ou ser desmembrado em honorificPrefix, givenName, familyName... E isso tem um custo: de se reconhecer as partes com precisão. O reconhecimento de honorificPrefix, por exemplo, é fácil se comparado com os demais, ainda assim é necessária a intervenção de um software e homologação da marcação automática realizada.

Supondo que o nível de maturidade 2 seja a marcação semântica.

Sugere-se estabelecer o nível de maturidade 3, cuja principal diferença para com o nível 2 seria essa capacidade de processar a granularidade.

As marcações do nível 2 seriam ainda sujeitas a imprecisões de granularidade mas ao mesmo tempo garantidas pela presença dos elementos semânticos.

validar HTML5 do teste

Páginas do https://okfn-brasil.github.io/lexml-dou (demo) precisam passar no validador do W3C https://validator.w3.org/nu

Justificativa: para garantir consistência da proposta, mesmo sendo HTML5-onlyContent um subconjunto HTML5, a validação garante esse subconjunto, assim como compatibilidade na análise da página onde se encontra inserido.

Uma validação HTML5-onlyContent específica pode ser conseguida por pipe, ou seja, uma segunda validação apenas verificando as tags permitidas o a DTD específica desejada.

Introduzir mais um nível para a separação dos modos de processamento hierarquizado

A grande diferença entre marcar títulos com sua ordenação hierárquica (h1,h2,etc.) e marcar todo o bloco de seções que apresenta estes títulos, é a hierarquia, tipicamente o uso da tag section para estabelecer a transição do sequencial para o hierarquizado.

  • seções com section conforme seções LexML
  • sub-articulação (alíneas, etc.) conforme listas
  • rodapés, aside's, anexos, figuras, tabelas, etc. destacados.

Sugere-se explicitar essa diferença como nível de maturidade: dessa forma o nível 2 se tornaria apenas uma versão hierarquizada do nível 1, e a marcação semântica seria introduzida como posterior à hierarquia, como nível 3. A justificativa natural bem do uso do itemscope da marcação Microdata: ela requer mínimo de encapsulamento, e via de regra esse encapsulamento vem com a hierarquização da estrutura.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.