会议记录:2019年08月05日
会议地点:西区电三楼639
会议内容:
- 双方互相介绍
- 关于当前工作的讨论:
- 已有的调度策略没有太大性能问题:在实际生产环境中可能同一时间下99%的存储节点是idle状态,少量热数据的迁移意义不大。
- 从观测的角度来说,实验室小集群内的优化目标如I/O次数等,在实验规模达到千或万量级时不再重要。大规模集群中,数据的分布和调度方式成为新的研究对象,如何提高整体利用率和可靠性是新的难点。
- 对方关心的问题
- 类似微软Cosmos DB的多模态数据库的理论体系
- 多用户的公有云场景下,如何根据用户的profile来选择调度方法以及保证可靠性
- 如何选择后端存储I/O引擎(如RocksDB使用LSM Tree)