会议记录:2019年08月05日
会议地点:
西区电三楼639
会议内容:
双方互相介绍
关于当前工作的讨论:
已有的调度策略没有太大性能问题:在实际生产环境中可能同一时间下99%的存储节点是idle状态,少量热数据的迁移意义不大。
从观测的角度来说,实验室小集群内的优化目标如I/O次数等,在实验规模达到千或万量级时不再重要。大规模集群中,数据的分布和调度方式成为新的研究对象,如何提高
整体利用率
和
可靠性
是新的难点。
对方关心的问题
类似微软Cosmos DB的多模态数据库的理论体系
多用户的公有云场景下,如何根据用户的profile来选择调度方法以及保证可靠性
如何选择后端存储I/O引擎(如RocksDB使用LSM Tree)