得,今天唠唠“海洋石油113”这摊子事儿。也不是啥大事,就是前阵子沾手过一点东西,随便说说我的折腾过程。
怎么掺和进去的
本来,这块不归我管。但是,你知道的,有时候人手不够,或者碰到个怪问题,就得临时抓人顶上。那天就是,系统里报出来,“海洋石油113”那边传回来的几个数据老是对不上,断断续续的,搞得下游的好几个报表都跟着乱套。
领导找到我,说让我去看看,能不能捅咕明白。我当时心里就咯噔一下,海上平台那边的东西,跟咱们岸上坐办公室的不太一样,麻烦事儿多。
开始动手折腾
没办法,接了活儿就得干。第一步,肯定是先看日志。翻了半天,日志倒是不少,密密麻麻的,但有用的信息不多。很多都是些常规记录,看不出哪里出了问题。而且那系统,有点年头了,文档也不全,连蒙带猜地看。
然后想着,是不是网络的事儿?海上那环境,风大浪高的,卫星信号可能不稳定。我就试着联系平台那边的人。这也是个麻烦事。你想:
- 人家在海上作业,忙得要死,不一定随时有空理你。
- 通讯有时候也不太说话断断续续的。
- 隔着十万八千里,很多情况只能靠猜。
好不容易联系上了,那边的小哥也挺无奈,说他们那边设备看着都正常,没报什么错。这就头疼了,两边都说自己没问题,那问题出在哪儿?
中间那点破事儿
接下来就是反复试。调整了几个参数,重启了几个服务,都没啥用。数据还是老样子,时好时坏。搞得我那几天焦头烂额的。有时候半夜收到报警,还得爬起来看一眼。
我就琢磨,这“海洋石油113”不是个浮式的生产储油装置嘛就是个能存油能卸油的大船。我看资料说它外输间隔还缩短了,说明生产挺忙的。忙起来,各种数据传输量肯定也大,会不会是哪个环节处理不过来了?
但这也只是瞎猜,没证据。我又去看代码,好家伙,那代码写得…嗯…很有年代感。一层套一层,想找个突破口都难。改动,又怕影响别的功能,毕竟是生产系统,不敢乱动。
也就那样了
折腾了好几天,算是搞了个临时的解决方案。不是彻底根治,就是在数据接收端加了个更强的校验和重试机制。如果发现数据不对或者没传过来,就多试几次。效果嘛马马虎虎,比之前强点,至少下游报表不至于天天报错了。但根本问题在哪,我还是没完全搞明白。
后来这事儿就交给专门的维护团队继续跟了。我也撤回来了,继续干我自己的活儿。
总的感觉就是,海上平台这种东西,确实复杂。环境恶劣,设备维护难,通信也麻烦。咱们在岸上支持,很多时候真是隔靴搔痒。能保证它在那风大浪急的海上稳稳当当生产油,已经很不容易了。我这碰到的这点数据小问题,跟人家比起来,真不算啥了。
行了,今天就唠这么多,算是记录一下自己瞎折腾的经历。
还没有评论,来说两句吧...