Coder Social home page Coder Social logo

descript-to-video-core's Introduction

descript-to-video

plaintextやmarkdown形式のテキストから各種TTSライブラリを使用した動画に変換する

ツールの構成

  • yarn
  • marp(markdown->スライドの変換に利用)
    • standalone版にしたほうがよいか?
      • →してた サンプル以下(1920*1080)
      • yarn marp --image-scale 1.5 --images png -o E://Videos/VoiceroidWaveFiles/ resources/slides/template/template.md
  • tts-controller(テキストから音声合成エンジンを呼び出すのに使用)
    • ->各種音声合成エンジン
  • このツール本体(markdownのparse、aviutlで使用できるobjファイルのエクスポートに利用)
  • aviutl+拡張編集プラグイン(今のところは)
    • そのうち他ツール対応させたい(DaVinchiとか)

インストール

Download from http://example.com/FIXME.

使い方

javaの実行環境が必要です

$ javaw -jar descript-to-video-0.1.0-standalone.jar [args]

Options

FIXME: listing of options this app accepts.

...

動作のしくみ

  • clojureでmarkdownからttsで読み上げする内容の含まれている行を取得
  • marpでmarkdownからスライドを出力
    • 先頭行から順にテキスト内容をspeechSampleを使用して出力

既知のバグ

このプロジェクトはpre-alphaです

Motivation

解説動画を楽して作りたい、原稿ファイル一つ用意してバッチに投げ込んだらとりあえずスライドショーに音声がついてる程度の動画ができてるといいのでは?

TODO/検討事項

TODOというか検討事項と対応状況の書き散らし

  • markdonwから音声を一括保存する
  • 録音元の制約
    • スピーカーで鳴らしている音をそのまま録音している以上、ttsソフト以外で音を鳴らしているとそのまま録音されてしまう
  • 対応しているテキストのフォーマットを増やす
    • markdown
    • csv
  • 呼び出し元を追加する(少なくともターミナルはNG)
    • aviutl拡張?
    • batchfile?
    • ごちゃまぜドロップス拡張?
      • どのみちc#使うんだし呼び出し元はc#にしておく?
    • とりあえずgrpcのサーバーとしてバックエンドを書く、フロントは多分grpcの呼び出し元であればいいのでなんとでもなるはずだ(適当)
  • markdownと拡張編集オブジェクトファイルの相互変換
    • できました(yamlと相互変換)
    • 拡張編集のオブジェクトごとにaliasを作る
      • aliasだと立ち絵関係に対応できないのでテンプレの.obj
  • 依存関係の整理
    • 依存先のリポジトリをこっちに含める?
    • 現状では一部処理が外部のリポジトリ(ttsController)に依存、リリースを作る際にあっちのビルド後をこっちに含めるか検討
  • aviutl以外への対応
    • やるならDaVinchi Resolve?
  • 呼び出し関係
    • marpの呼び出し(yarn使用)
  • ttsController呼び出しをいい感じにする
    • grpc使うとか
    • とりあえず:現状としては別途リポジトリをcloneした上でプロジェクトをビルドしてもらわないといけない
  • テストの追加
  • エラーハンドリングをちゃんとやる
  • テンプレートを使えるようにする
  • 設定変更にUIをつける
  • フォルダ構成を考える
    • .aupと参照先のリソースは同一フォルダに入れる。
    • .mdも同様に.aupと同一フォルダに入れるか?
  • これ自体のサンプルスライド

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.