zephyrer / contactmanagement Goto Github PK
View Code? Open in Web Editor NEWAutomatically exported from code.google.com/p/contactmanagement
Automatically exported from code.google.com/p/contactmanagement
将已有的软件反编译,参考其中的算法和软件的架构。
有可能么?是否有价值?
Original issue reported on code.google.com by [email protected]
on 22 Feb 2011 at 5:28
鉴于新加入的几位同学都是玩linux的,
在真正开始项目之前,我们统一一下开发环境吧。
大家晒晒自己的开发环境吧。
然后,讨论两个问题:
1、我们选什么开发环境。
2、UI 用qt还是mfc写?
Original issue reported on code.google.com by [email protected]
on 23 Feb 2011 at 3:00
1.分类/预测:决策树算法
面向有规则问题时的有效方法,能发现数据中淹没的潜��
�则。对于分类记录或预测离散结果,决策树是首选。同时,�
��策树比其他技术需要的数据准备更少,几乎在每个数据挖掘
工程中都会被用到。
尽管建树的算法有多种变体,建成的树的形态与效率也��
�差别,但具有相同的基本过程,即相对于目标变量而言,每�
��新生节点比其原生节点有更好的纯度。只要达到这个目标,
多次迭代后总会得到对数据集的一个划分。
最佳拆分方式的度量:降低发散性,提高纯度。目前的��
�度度量有基尼、熵、信息增益率和卡方等。使用基尼准则建�
��的树更倾向于产生两个纯度都较高的子节点的拆分,而不是
一个更纯的加上一个大而不是很纯的子节点的拆分。熵准则��
�倾向于纯度,即时得到的节点很小。因此熵准则适合于确有�
��晰的潜在规则的领域,对市场营销这类模糊领域,会导致不
稳定的树。
决策树的年轮图是很酷的表示方法,能够应用在商业环��
�中。
2.预测/分类/聚类:人工神经网络
训练网络的过程实际上是内部调整权重的过程
过拟合:在验证集上,较早几代往往比最终网络更好
前馈网络中要明确的核心问题:激活函数是什么、网络��
�扑、反向传播是什么
隐藏层越宽,识别模式的能力越强。副作用是网络可能��
�记住某一种模式,我们需要网络从训练集中总结,而不是记�
��模式。
反向传播网络的最优化算法:爬山和模拟退火。危险在��
�陷入局部最优
神经网络是不透明的,我们无法了解他如何工作,灵敏��
�分析可以帮助我们观测这个网络(很有意思)
3.推荐与推理:最近邻(协同过滤)
这种算法是一种MBR(Memory-based
reasoning),它能够适应不断加入的新数据,但同时也是数据贪�
��者,需要大量历史数据
4.关联规则
三个判定规则:置信度、提升度和否定规则
5.链接分析:就是图论,欧拉图和哈密顿图的应用。Pagera
nk应该放在这部分,不过书中没讲。
6.自动聚类:k均值和GMM
7.市场营销中的风险函数和生存分析
客户行为的重要指标:保有期tenure,客户曾经多久为我��
�提供了很多信息。客户半衰期:用衰变曲线解读客户。
风险的定义:假设用户已经保有t时间,其在t+1之前离开�
��概率
常用模型:浴缸型函数
8.遗传算法:通过进化实现最优化的强力技术,显然可以
用来训练神经网络。进化功能的关键参数:基因组、适应度��
�数
9.一个数据挖掘团队需要的知识体系
RDBMS技能(SQL)
工具与编程(SAS、SPSS...)
统计学
机器学习技能
行业知识
数据可视化技能
访问及需求收集技能
展示、写作与沟通
Original issue reported on code.google.com by [email protected]
on 22 Feb 2011 at 5:29
16:11:14
我认真看了一下你们软件的功能,在人脉信息的存储和分类��
�面做得相当棒~
名片之星 16:11:59
多谢表扬啦
16:12:19
我更多的关心,对这些信息的分析和处理。
毕竟,存储信息的目的就是为了分析和应用。
16:14:22
我们现在的状态是,先写出一个具备基本电话本功能的软件��
�然后再添加人际关系分析的功能。
16:15:35
前期的目标基本就是写出一个类似于 名片之星
这样的软件。不知道咱们是否可以资源共享一下?
16:16:13
我们现在只是个学生,做这个东西,一是为了自己使用方便��
�二是为了提高一下项目经验和编程的能力。
16:16:21
希望您能够指导一下~
名片之星 16:17:37
很抱歉,我们只进行商业合作,其它方面的交流暂不考虑
16:19:42
那你们对于增加软件的数据分析功能是否有兴趣?
如果有,给我们几个API接口,或者可以调用数据的方法,我��
�给你们做一下插件。
名片之星 16:21:20
顺便问一下,您是如何知道名片之星的?
16:21:34
google里面搜索到的
名片之星 16:23:04
你们用什么工具开发插件啊?
16:25:28
我们做好用c/c++实现功能,然后给你们演示一下。如果满意,
可以把代码给你们。剩下的,应该很容易了吧。
16:27:26
我们也可以自己独立做的,只是感觉,如果合作的话,可以��
�我们节省两到三个月的时间。对你们,也是有帮助的。
16:28:29
你们现在的软件,只是一个孤立的软件,跟手机、社交网站��
�基本没有交集
16:29:05
要想推广一定的群体范围,还是有一定难度的。
16:30:35
很少有人在电脑上管理联系人,也很少有人懂人脉和社交网��
�的相关理论。名片之星的功能就是把人脉信息存储到电脑上�
��然后方便用户进行分析。一般人,根本就不会分析的。
名片之星 16:30:46
你们计划插件实现哪些功能啊?
16:36:07
关于这个,暂时只是有一个初步的想法。
毕竟我们现在还处于实现改进版的电话本的功能这个阶段。
举几个例子:
1、根据交往的频率、交往时间等,分析人与人之间的关系密�
��程度,并给出预测,以及影响关系的瓶颈。
2、分析一个组织、团队的团结度等。
3、根据共同拥有某兴趣的好友数量分析个人的人际圈子是否�
��衡。
名片之星 16:37:15
那这些功能跟手机和社交网站有何关系啊?
16:37:15
这些只是初期出现的一些想法。如果真要做的话,需要把你��
�现在的软件增加一些功能和信息,用上一段时间,然后才能�
��出比较好的需求分析
16:37:52
手机和社交网站是第二步扩展。
16:38:17
没有第一步作为基础,盲目的扩展,无意义。
16:40:24
或者换个说法,我们缺少相应的经验,暂时无法跳过第一步��
�接思考从社交网站提取那些有用的信息,又如何为客户提供�
��们所需要的功能。
16:41:55
另外,我觉得,单纯依靠出售软件的盈利模式,很难长期的��
�展下去。不知道你们是否考虑过换个思路?
16:44:45
还在么?
名片之星 16:44:47
[自动回复]您好,我现在有事不在,一会再和您联系。
不再提醒
名片之星 16:49:59
zai
名片之星 16:50:21
感觉你们这些思路很不错
16:50:21
之所以能够检索到 名片之星,
根本原因还是我们前期打算实现的功能与名片之星相似。
我想,做出这些功能,还是没有多少技术门槛的。
对于我们来说,三个月足够。
虽然很难像 名片之星
这么棒,但是核心的功能肯定是没问题的。
我们自己做着玩的话,肯定会开源的。
而您如果想实现我刚刚说的那些功能,把我们甩在后面,我��
�得,很难。
您慎重考虑一下吧。
名片之星 16:51:18
但是你们这些思路好像更适合于去跟社交网站合作,因为他��
�有大量的数据需要深度挖掘
名片之星 16:51:48
名片之星为个人服务,数据不会太多,几百条至几千条而已
16:52:05
我们也主要是为个人和小团队服务的。
16:52:58
现在不都流行小团队嘛。您的开发团队应该也是几个人组成��
�小团队吧
16:54:38
与社交网站合作,那个有点远了。呵呵。至少最近不会考虑��
�些。
16:54:58
现在的重点是做出软件。我着急自己用呢。呵呵。
16:56:29
能否知道您现在的态度?是否愿意合作,如果愿意,有哪些��
�虑。
名片之星 16:57:35
感觉好像没有什么实质性的合作点
16:58:26
那我们就做自己的了,打扰了。
名片之星 16:58:48
OK
Original issue reported on code.google.com by [email protected]
on 22 Feb 2011 at 8:59
软件需求分析
参考文章:
维系人际关系是一种责任 http://www.douban.com/group/topic/17770307/
Original issue reported on code.google.com by [email protected]
on 22 Feb 2011 at 4:56
大家写一下自己的简要介绍吧。
主要包括:
1、年级专业。
2、项目相关的知识技能。
3、参与的主要目的。
4、感兴趣的方向(该项目的子方向)。
相互了解一下,以便更好的合作。
Original issue reported on code.google.com by [email protected]
on 21 Feb 2011 at 1:26
这需要一定的软件开发经验。
而我并不具备。
Original issue reported on code.google.com by [email protected]
on 21 Feb 2011 at 12:15
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.