loceyi / satellitesmissionschedule Goto Github PK

View Code? Open in Web Editor NEW

3.0 3.0 18.0 73.23 MB

Python 66.11% Jupyter Notebook 31.96% Shell 0.01% C++ 1.92%

satellitesmissionschedule's People

Contributors

Stargazers

Watchers

Forkers

fatianbao zuers oniros6 archer-y zjcopy-cuclife sh221by rennerpowell pursuettt frxiuxian xxxleonie revincxt wenjun19 kaishiss newhuc celestialjy jackeyloveasdzz111

satellitesmissionschedule's Issues

关于如何获取最佳解的问题

我觉得可以不用最后得到的解来算，而是可以取整个计算过程中reward最多的那个episode的解法。

python类变量和实例变量

类变量：可在类的所有实例之间共享的值（也就是说，它们不是单独分配给每个实例的）。
实例变量：实例化之后，每个实例单独拥有的变量。

class student():
age = 0
name = 'stu'
# age,name是类变量
def init(self,age,name):
self.age = age
self.name = name
# 访问实例变量(用self.age self.name)

student1 = student(18,'hello')
print(student1.name)

打印实例变量，输出hello

print(student.name)

打印类变量，输出stu

————————————————
版权声明：本文为CSDN博主「七分半刚刚好」的原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_43465312/article/details/90725277

关于STK Coverage和Access的问题

1.Coverage是计算覆盖性，若计算地面目标（no radar）对于卫星的coverage，则得到的是可见性。
2.如果是计算sat而不是子目录下面sensor的coverage，得到的也是可见性而不是覆盖。
3.在x目标下面的子目录点击coverage，计算得到的是x目标对于assigned target的覆盖，就是传感器能否探知到assigned 目标。

tf.variable_scope

https://blog.csdn.net/HYXING520/article/details/80889496

关于git的merge问题

如果同时分开两个分支，并且两个分支各自之后都有修改，在合并时，merge a into b, 则a中修改而b中没有修改的地方会被添加到最新的版本中，但a中修改而b中也修改了的地方会产生冲突，你需要选择选择哪一个文件的修改内容

关于simulink的工作原理

1.simulink Simulink模型中Configuration Parameters https://blog.csdn.net/qq_17777405/article/details/80853052

超参数的调节

https://blog.csdn.net/mzpmzk/article/details/80136958

关于PG AC的收敛问题

PG和AC的收敛性不是很好，发现一开始可能收敛到最佳policy，跑着跑着又发散了，然后再收敛到其它次优解

关于 'TWorbitdata3ECEF.csv' 文件

请问 TimewindowGet.py 中输入的 TWorbitdata.csv 和 TWorbitdata3ECEF.csv 是如何得到的呢？

关于状态量选择的问题

2019/11/26 小思考：状态量选择的本质是为了辨识出卫星的可接受任务的的状态，最简单的状态量设置就是记录卫星已经接收和拒绝的任务，判断下一个任务是否可执行，但是那样的话要么卫星状态量大小在变，而且状态量越变越大，因此采用（timewindow，energy，nexttask）代表那些状态量，可以用较小的状态空间来表示较多的状态。

问题：如果有一模一样的任务很多的话，卫星可能选择了不同的任务接收或拒绝，但对应的状态量是可能重复的，也就是说，卫星已经接收和拒绝的任务这个状态与我们新定义的状态量并不是单一对应的。这样的话，如果使用q-learning的话就会把本质上的不同状态更新到同一个状态里面。这样是否会影响呢，就解决任务规划问题而言？

可能的回答：就任务规划问题而言，卫星的tw，energy，是判断是否能执行其它任务的物理限制，如果卫星当下tw，energy，nesttask都相同的话，即使在过去卫星已经接收的任务不同，但对于将来的选择应该是一样的，所以可以看作同一个状态去评估其好坏。

关于搜索成像时间的问题

如果是只给出时间窗口，不仅仅需要选择时间窗口，还需要选择成像的时间，这就好像有点像continuous问题，后面需要思考一下

文章数据证明的重点

发现如果单纯用苗悦文章中的数据去仿真，得到最优解的概率并不是很大，打算从大规模任务入手，只要可以得到一个较高的reward即可，不要求best，而且苗悦的方法需要对任务进行分级

关于任务开始时间的规划问题

1.发现一个问题就是，像遗传算法，mip等方法是可以顺带规划出任务开始的时间，而不是直接给出任务的执行时间再规划选择，而rl如何实现这一目的呢？

关于DDPG只能在连续问题中使用

默认你这里指的是动作空间是离散的。理论上，DDPG无法处理离散动作空间的问题。因为在DDPG中，要求策略函数（输出动作）相对于状态是可导的。如果是离散的动作，显然不满足。如果非要用，我想大概也只能拟合一个连续函数来近似离散的动作。但是这个函数可能很复杂或者不光滑。另外，DDPG本来就是为了解决连续问题开发的，相当于DQN 的连续版本。如果你非要用梯度的方法解决离散问题，不如试试PPO或者A3C。

作者：张文
链接：https://www.zhihu.com/question/336743099/answer/762702214
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

关于任务规划使用model based方法

1.任务规划的问题比较特殊，因为整个环境是人为设定的，如果用model based的话，整个环境模型是可以很准确的给出来，那与直接和环境交互没有区别了。

The cart is free to move within
the bounds of a one-dimensional track. The pole is free to
move only in the vertical plane of the cart and track. The
controller can apply an impulsive "left" or "right" force F
of fixed magnitude to the cart at discrete time intervals.
The cart-pole system was simulated by digital computer
using a very detailed model that includes all of the nonlinearities
and reactive forces of the physical system (the
Appendix provides details of the cart-pole model and
simulations).