随着人工智能技术的迅猛发展,大数据已成为获取新的军事及技术优势的关键因素。同民用大数据相比,军事大数据具有的高安全性、强对抗性、边界不确定性等特点,决定了其数据价值较为稀疏,真假数据错综交织,数据迷雾伪装欺骗现象普遍存在。
数据迷雾,通常是指阻碍正确高效获取数据价值的各类数据。一般而言,包括假数据(混淆判断)、毒数据(诱导犯错)、垃圾数据(毫无意义和价值,浪费算力和时间资源)。未来战场上,数据迷雾可作为敌我攻防的重要“武器”,己方通过主动释放数据迷雾,从而迷惑敌人、隐真示假、诱骗对手、占用敌方资源、降低敌方指挥效率等;同时,还要采取技术手段对获取数据进行甄别评估,识别迷雾陷阱,避免落入敌方圈套。有效破除数据迷雾,尽快找出反映战争活动本质的真实信息,将成为大数据时代的新战法。
随着军事领域应用的日益广泛,大数据技术在破除数据迷雾方面的“双刃剑”作用日益显现,攻防双方在成本效益上存在着本质差异,极有可能成为未来塑造不对称作战优势的重要手段。由于深度学习算法的不足,基于大数据的人工智能系统在可解释性和可信性上有着先天缺陷,极易受到攻击。比如,对于图像识别,一张阿尔卑斯山照片在有针对性施加少量噪点后,人去看还是阿尔卑斯山,机器却可能以99.99%的概率将其识别为一条狗。再比如,对于声音识别,同样一句话加上一点噪声后,人听起来还是一样,但机器听起来已经完全不同。人工智能系统的这种不可解释性、脆弱性,使得数据迷雾攻击更加便捷、花费成本更低、防护难度更大。
有效应对数据迷雾带来的严峻挑战,需遵循“以正合,以奇胜”的思路,加强军事大数据基础技术研究,建立集知识引导、数据驱动和经验学习于一体的融合分析模型,改变当前仅依靠数据驱动的智能实现模式,提高基于大数据的人工智能系统的可解释性和适应能力等;加强军事大数据治理技术研究,构建数据试验验证方法和手段,进行实战化验证,提高数据真伪分析能力,确保数据的时效性、真实性和可信度。同时,还要建立完善相应的数据备份和验证手段,提高大数据风险控制能力,避免陷入数据泥潭。