7

大数据资讯 大数据在当今商业世界中的可靠性如何?

 3 years ago
source link: http://bigdata.idcquan.com/news/184311.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

《经济时报》最近的一份报告提到,宝马利用AWS开发了一个数据中心以提高效率。该报告说:“将培训约5000名BMW员工使用AWS技术来更好地利用数据。”技术的出现在经商过程中带来了明显的变化。大数据和预测分析对行业产生了巨大影响。

Gartner公司对于大数据的定义是,大数据是高容量,高速度以及种类繁多的信息资产,即3V。这些大量复杂数据无法用传统方式处理。大数据用于获取见解,检测威胁,预测趋势以实现最佳生产。

人脑从来没有过无错误的特权。这不是为什么我们更偏向于技术-一个提供完美结果的平台。好吧,事实不同。一切都有自己的风险。大数据也是如此。为了清楚起见,以下看与大数据相关的问题。

准确性

许多人认为,数据越多,准确性越好。这不是真的。大量数据来自各种不完善的来源。这可能导致无组织,不准确的数据或见解。当这些值仅仅是近似值时,我们将失去精度。所有公司都没有能力实时处理大量数据。因此,他们使用采样来分析数据。此过程使用来自云的少量数据样本,并尝试获取见解。这导致不正确的结论和决定。

数据是否一致?

数据必须一致才能获得正确的见解。数据永远不会是静态的;它一直在变化。由于数据收集来自多个来源,因此保持一致性并不容易。如果数据不一致,用户可能会误会。对于同一查询获得不同的答案可能会导致这种不一致。

数据算法中的偏见

由于这些数据块来自多个来源,因此并不总是可信的。这些数据离偏差不远。由于人的大脑参与其中,因此这些不是客观价值或信息。某些数据可能包含从其源继承的偏差和错误值。

使用算法进行数据处理也会导致偏差。数据算法中的这些偏见不是一本公开的书。它们仍然被认为是黑匣子,这使我们无法了解其根源和目的。这可能会导致误解。例如,人们可以用各种方式来解释社交媒体语言。如果算法被设计为以性别歧视或种族主义的方式理解它,则会导致错误的见解。这肯定会影响用户,在其他情况下也会影响您的业务成功。

如何使事情变得更好?

所有这些偏见不能使大数据消失。大数据将仍然是有效业务管理的重要方面。因此,它需要设置正确。

•应该改善数据质量和组织。为确保这一点,公司应了解其数据要求并定义相关数据。这些数据应该以易于管理的方式进行分类和存储,以获得有效的结果。

•一切都需要偶尔清洁。应该清除数据以清除脏数据,这些脏数据离完整性很远。这将使我们能够创建一个完整且相关的数据湖。

•更好的治理可以轻松解决数据流和安全问题。例如,SAPDataHub可确保最大程度地集成和管理数据库,以产生有效的业务策略。

•为了增加对技术的信任,必须确保对用户的最大透明度。更好地理解所涉及的来源,偏见和错误将对客户产生积极影响。更少的操纵和更多的统计证据可以帮助赢得信任。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK