面了头条的测试开发,居然挂了:1.自我介绍2.怎么收集一…

面了头条的测试开发,居然挂了:
1.自我介绍
2.怎么收集一个分布式集群中的log
3.怎样一个json字符串转换为二进制流(面试官说二进制和二进制流不一样)
4.写一个函数实现调用api用的时间
5. 将一个3Gb的文本数据放在内存里面排序。问题是排序高人帮忙指点一下

楼主:还有一个问题是rest API内部是怎么实现的

字节跳动员工:??

陈近南:分布式集群的log,flume?

楼主:感觉是要从架构的角度去考虑问题

楼主:这个问题,我是真的搞不清楚,看源码吗?

楼主:我回答写代码是的每一步原子操作都记录log,然后从 log里面设置error info等关键字,方便以后检索

字节跳动员工[2]:m

北京壹号车科技有限公司员工:m

昆仑弟子:几年经验

楼主:加实习算下来5年

互联网公司员工:m

网易游戏员工:有点难啊

蚂蚁金服员工:二进制流是啥意思,什么场景,需要定义编码协议?

俞莲舟:有点厉害

蚂蚁金服员工:多大内存,排序用sort有问题?构造字典树再遍历?

程序猿.Bosch:居然没有红黑树,差评

楼主:说是可执行文件,我一直在回答二进制数据,这个真心不知道

程序猿.恒山弟子:挺简单的啊

楼主:我也觉得,我水平不够[流泪]

楼主:1G内存

楼主:这个问题考察点是在哪里?数据结构排序?

楼主:高人加你,请教

迷途中的希望:m

嵩山弟子:m

桃枝仙:排序的话就是外排序咯。先分成小文件能装进内存大小,内存中任意方式排序,再对小文件归并排序

沉迷学习员工:要用不耗内存的就地排序?

程序猿.简雍:第二个问题是Elk?第三个问的是序列化吗?第四个没看懂题目!第五个很常见的题目,只要能答出来时间换空间,就能得一半分

程序猿.七月流萤:分布式集群的log就elk那一套啊

字节跳动员工:原来是五年....我看得一脸懵逼

楼主:第二个问题方式我想到ELK了,但是感觉他的意思要自己造轮子的意思

楼主:第三个问题,不知道面试官是不是问pytoexe,表示能力有限

安道全:二进制编码吗

楼主:您的意思是python里面每个直接转换二进制的函数吗?还是?这个说是二进制流?

宋兵乙:有可能是让你想怎样从log定位到具体机器或者定位整个请求链路?

暖羊羊:m

楼主:第四个是编程题,用装饰器写了,面试官说对了70%,很是伤心

安道全:不是 json 格式可以二进制编码也就是序列化 这样节省空间