Coder Social home page Coder Social logo

xiaoli1368 / microphone-sound-source-localization Goto Github PK

View Code? Open in Web Editor NEW
167.0 3.0 34.0 7.65 MB

:microphone: Microphone sound source localization by SRP-PHAT and others numerical methods.(基于SRP-PHAT的麦克风声源定位)

MATLAB 100.00%
srp-phat tdoa matlab

microphone-sound-source-localization's Introduction

麦克风声源定位

当前项目基本上实现了基于麦克风阵列的TDOA-SRP的声源定位功能仿真,整体代码基于Matlab进行开发,能够较好地进行定向,但是在定距方面尚有不足。

目录

介绍

首先,需要说明的是当前的代码仅实现了功能仿真,对算法原理的理解有一定的帮助。由于在实际中缺少麦克风阵列传感器,因此本例所使用的原始数据是利用手机录音得到的。同时考虑到即便使用多个手机也无法实现绝对地同步录制,因此这里直接利用一路语音信号的时延和加噪来代替其它通道的信号,这样便得到了仿真中使用的原始数据。

TDOA-SRP算法主要由以下两个步骤实现:

  • 首先,利用GCC-PHAT估计出各个通道之间的时延。
  • 然后,利用SRP-PHAT进行声源位置的估计定位。

其中在第二步的过程中,本例使用到了空域收缩的方法,即使用球坐标进行搜索并且逐渐缩小搜索的范围(指角度),通过计算每个角度方向上的SRP总和来衡量该方向是否应该被收缩域囊括。但是对于距离的判定出现了较大的误差,因此当前只能实现测角。对于距离定位,还需要对几何以及SRP的原理进行系统的分析才可以完成。

除此之外,本例也使用了一些基本的数值计算方法来尝试进行求解,结果也是能够实现角度定位,但是难以实现距离定位。更加精确的定位还需要进行算法层面上的进一步改进。

使用说明

  1. 当前代码由matlab运行。

  2. 这里TDOA_method.m为主程序,直接运行即可。

  3. mat文件为四路麦克风采集到的语音信号,如果想要使用自己的数据可以参照mat内文件的存储名称,相应的改为自己的语音文件。如果想使用多路麦克风的模型(如6路)则较为困难,需要将所有代码中涉及到四路处理的内容全部修改。

  4. 麦克风阵列模型的坐标在主程序中以完成初始化,必须时可以自行修改。

  5. 这里调用了几种不同的进行声源定位的子函数,其中主要的方法只有两种:SRP-PHAT以及数值计算法。

许可

MIT © Richard McRichface

其它

如有疑问,请与我联系。

microphone-sound-source-localization's People

Contributors

xiaoli1368 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

microphone-sound-source-localization's Issues

question

请问有c++/c/python版本的吗

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.