1 | 场景:使用Spark 读取MongoDB中的集合数据,由于文档比较大。mongo-spark-connector 插件默认选择 1000条了推断schema 导致缺失字段。 |
1 | 解决办法1:最懒的办法。先查询出来需要读取的数据count,然后在查一下设置sampleSize的大小。可以搞定 |
1 | 解决办法2:获取要查询的字段的list,自己定义schema |
1 | 解决办法3:定义结构类 |
1 | 场景:使用Spark 读取MongoDB中的集合数据,由于文档比较大。mongo-spark-connector 插件默认选择 1000条了推断schema 导致缺失字段。 |
1 | 解决办法1:最懒的办法。先查询出来需要读取的数据count,然后在查一下设置sampleSize的大小。可以搞定 |
1 | 解决办法2:获取要查询的字段的list,自己定义schema |
1 | 解决办法3:定义结构类 |