在过去十年中,人们已经看到“自我量化”的出现,也就是通过数据更好地了解和改善自身的状况,这些数据可能是你每天的卡路里消耗量,也可能是你每周的睡眠时间。而现在这种概念已经被应用到整个社区中,并且会像影响个人一样对城市的运行产生影响。例如,你可能认为自己今天走了不少路,而计步器经过快速核实后可以告诉你精确的距离。这种概念不仅可以让城市规划者和政府官员更加清楚地了解城市的运作规律,还可以帮助他们作出更好的调整,包括如何更加有效地利用资源,如何创造更安全和更适于步行的社区,或最佳的交通方式。在美国,“风城”芝加哥正采用先进的大数据预测模型,精确定位城市风险领域,对包括鼠患、铅中毒等在内的城市顽疾开出处方。
全世界的城市病几乎都是雷同的:每年总有小孩会因为接触家装涂料或水管而铅中毒;总有一些餐馆的卫生环境不达标;总有不自觉的车主在市中心乱停车;总有某些社区帮派分子特别活跃;总有这个或那个角落会突然冒出大量老鼠……在像芝加哥这样人口超过250万的特大型城市,这些问题可以说无法避免,而让人抓狂的是,没人能确切知道某个城市病将于何时何地爆发。
不过,在芝加哥市长拉姆·艾曼纽看来,在大数据时代,与其被动接受那些突如其来的“紧急状况”,不如借助大数据的兴起未雨绸缪主动出击,通过打造强大的大数据预测模型并将其纳入日常城市管理,改变特大型城市面对顽疾“不定期发作”时束手无策的尴尬。“在像芝加哥这样的特大城市,没有一件事情是会突然发生的。事实上每件事理论上都应该有迹可循,而大数据的出现,让我们有可能对这些风险进行分析预测。它要比一群人关着门想出来的对策更有效,而且成本更低。”拉姆·艾曼纽说道。
城市管理引入大数据
芝加哥市政府于2年前启动了一个新项目,目前处于试点测试阶段。该项目通过分析家庭调查记录和人口普查数据等要素,提前预测出城市运行的薄弱环节,比如哪些区域的儿童更可能发生铅中毒,在孩子们暴露于高铅危险环境之前,就找到问题点。“我们能主动、提前避免问题发生,而不是仅仅对已发生的问题做出被动反应。”芝加哥公共卫生部首席创新官杰·巴特说,“儿童铅中毒预测只是在公共卫生领域启动大数据预测性分析的开始,很高兴我们正处于这一领域的最前沿。”
理论上,开展这类大数据预测项目必须建立在该市已拥有提高城市“智商”的基础之上,即具有大规模的足量数据。2012年,芝加哥市政府就建立了“风网”(WindyGrid)大数据平台,收集建筑物的历史数据、公交车位置信息、推特和报警电话等最新数据流。风网大数据平台的设计初衷仅是一项概念证明,不对公众开放。但以风网为基础的另一个名为“完全”(Plenario)的大数据平台,则允许公众在线访问有关数据。
随着这些大数据工具不断推出,其应用操作也日趋丰富。例如,芝加哥开发了一项大数据工具,能把市政热线对鼠患的投诉与引发鼠患的特定区域条件(如管道漏水、垃圾投诉增多等)匹配起来,于是环卫管理人员能
提前到达那些潜在的问题区域,主动采取治理行动。去年,芝加哥居民的灭鼠需求下降了15%,人们似乎看到了成效。
当然,要提高大数据预测分析的准确率并不容易。芝加哥城市计算和数据中心主任查理·卡特利特正在调查一个警察圈内广泛流行的说法,如果气温骤降,城市各个地区的暴力犯罪事件会迅猛增加。但他发现这一现象缺乏合理的理论解释,而在数据及模型缺失的情况下,管理者很难检验这一说法的有效性。“对于城市治理的很多方面,我们都缺乏基本的理论依据来解释城市运作的方式。”卡特利特说。
不过,随着全球范围内越来越的城市开始使用大数据工具整治城市病,大数据预测模型正逐步走向成熟。2011年,纽约通过大数据技术,成功定位到更易发生火灾的建筑物,即通过分析聚焦逃税、不付公共事业费以及周边的犯罪率、事故发生率等数据,预测出一批超过平均火灾发生概率的建筑物。
消防人员在有针对性地检查这些楼宇时,确实比传统的撒网式扫楼,排查到了更多的消防隐患。
还有不少城市在尝试基于大数据预测的提前出警,根据历史的犯罪发生率,预测未来可能发生犯罪的区域。
大数据预测分析可能成为城市治理的福音,可以使现代城市运行更加高效,世界各地的城市都已经开始试验大数据项目,并且看到了显著的改善结果。
2012年,IBM公司与法国的里昂市合作,通过其推出的首个智能交通项目减少交通拥堵。在使用实时数据和对最佳实践法进行计算后,交通工程师可以作出更明智的决定,例如在发生交通事故时如何进行道路封闭,或是如何通过交通标志建议绕行,以帮助司机避免交通拥堵。在加拿大的温哥华市,警察局自2008年以来就开始使用以分析为主导的监控策略。通过使用数据确定犯罪热点地区及模式,使得该市2013年的财产犯罪率下降了24%,暴力犯罪率下降了9%。加拿大另一大城市多伦多也与IBM公司合作创建了一个社区门户,承诺使用大数据分析法监测该地区的所有事务,例如公共安全、以及社区的节水情况等。
大数据管理“绿色社区”
纽约大学城市科学与进步中心副主任康托科斯塔认为,大数据将使城市生活更加健康、更加灵活、更加公平,从目前来看,在城市管理的各个环节中,应用大数据提高能源使用效率,相对而言更容易入手。
身为城市规划专家,康托科斯塔的确是有感而发,他目前的另一个身份是纽约哈德逊园区开发团队顾问。哈德逊园区是纽约有史以来规模最大的房地产开发项目,项目位于曼哈顿西部、毗邻长岛铁路场的“铂金地段”。这一占地超过28英亩的超大规模社区将建造15栋混合用途大楼,其中包括办公室、住宅单元、商业空间,以及餐厅、酒吧、一家酒店、一所学校和14英亩开放的公共空间。目前该社区已经破土动工,预期第一阶段的项目将于2018年完工。
根据现有规划,哈德逊园区的大部分地区都将安装传感器,以监测从能源消耗到行人流量等各种数据。与此同时,在此基础上设置的各项环保设施也让人眼前一亮。以令人望而生畏的废弃物管理为例,哈德逊园区将采用庞大的真空管道系统,从每栋楼宇收集垃圾到中央处理端,也就是说园区居民无需忍受垃圾车午夜穿行的呼啸。能源方面,园区将在现场配备发电机组,居民无需担心因飓风等突发原因而遭遇停电,并且园区内还将建立小型电网,楼宇间可共享电力资源……在康托科斯塔看来,哈德逊园区将成为全美第一个“量化社区”——城市管理者收集数据的范围将空前广泛,下到相对简单的收集用电、用水数据,上到用先进的高光谱成像工具实时测量温室气体排放和空气污染物。
近年来,纽约在全球城市大数据应用领域处于领先地位。2009年,时任纽约市长的布隆伯格签署法令,规定面积超过5万平方英尺的私人楼宇每年要提供用电用水基本情况报告。与美国LEED绿色建筑认证只评价楼宇启用时的状态是否达标不同,纽约的绿色建筑评估更为严格,持续覆盖楼宇使用的全过程。
根据当时布隆伯格的要求,康托科斯塔撰写了2012年纽约绿色建筑评估报告。与此类报告一般关注房龄、能源类型、地段、规模等常规能耗指标不同的是,康托科斯塔的报告指出了中高层建筑能耗与哮喘急诊量之间的相关性。这份报告发表后在业内广受好评,也引起了纽约哈德逊园区开发商的关注。
打造可量化的宜居城市
事实上,利用持续收集的数据和实时数据采集进行比对分析,从而发现城市运行中各类不同事件之间的关联度,正是大数据在城市管理中的核心应用。放眼全球,许多城市都开始使用信息技术来提高城市的运营水平,比如在旧金山,闹市区的停车以进入车流的多少来浮动定价;在新加坡,市政府以车辆的实际使用情况为基础收取道路税……这一切都离不开大量的数据采集和分析。不过康托科斯塔认为,哈德逊园区是独一无二的:“我们在园区内测量的不只是建筑或基础设施的数据,还试图衡量人如何与空间互动,物理性的空间设计如何影响人们的生活、公共健康,乃至社会交往。”他同时强调,哈德逊园区各项大数据信息披露,均以当事人的同意为前提。
哈德逊园区的开发为纽约大学城市科学与进步中心的师生们提供了理想的实验场所。这个年轻的研究中心在2012年由前市长布隆伯格发起,坐落于布鲁克林,旨在通过大数据应用引领一门“城市科学”。从市郊出租车是否够用,到噪音扰民对健康、犯罪、教育成果以及房产价值产生的影响,均属该中心的研究范围。
康托科斯塔不只是处理数据本身,关键在于他把大数据应用到城市各个角落。“在数据与城市相关联的问题上,业内分裂为两大阵营。”他解释道,“一派认为只要把已采集到的数据关联起来,加以分析,看看能发现什么有趣的模式并作出反应;另一派则主张先提出重要、有趣的问题,然后把所需的数据找出来,再开始解决这些问题。”康托科斯塔认为这两种方式都有可取之处,但显然他站在后一阵营:“大数据的关键在于你所提问题的本质。我重点关注的是进一步理解大数据如何影响人们的行为。”
康托科斯塔的教育背景值得一提,土木工程本科、房地产金融硕士、城市规划博士的黄金组合,使他的工作核心定位于“思考社会公平和社会正义的问题,以及我们正在努力实现的事业对社会产生的影响。这个视角非常有用,但很多工程或科学背景出身的大数据业者,不大有机会从这一角度切入探索。”
纽约大学城市科学与进步中心的目标是真正打破学科间的藩篱,不仅需要计算机、工程学、环境学、社会学等背景的专业人才,更需要社会科学家们抛出问题,取得相关数据,关键是上述两个阵营的专家能共同合作,破解这些问题。
“我知道我的视角肯定与大型科技公司大相径庭,比如他们非常重视物理层面以及在物理基础架构上可实现的数据。”康托科斯塔承认,“我把重点放在进一步理解数据如何影响人们的行为,以及使用何种可获得的信息类型,真正吸引更多人们参与到规划过程中来。”
一种声音:隐私问题难以避免
在我们生活的城市中,随处都有摄像头和传感器,在不被察觉的情况下搜集数据,例如通过步行、骑车、搭地铁、开车移动的数据;你每月的水电使用量;你的垃圾生产量及其去处等……经过特别搭建的数学模型,这些枯燥的数据会成为城市管理者的助手,让城市的运作更为顺畅。
不过,在享受大数据为城市管理带来好处的同时,大数据收集所面临的隐私问题正变得难以回避。目前大数据项目收集的信息通常都是匿名收集或是进行汇总,并且只有在当事人选择参加该项目的情况下才能收集数据。也就是说,仍有许多人不愿意相关机构对他们的数据进行跟踪和分析。相当多的大数据研究者乐观地认为,随着人们在网上越来越自由地分享他们的信息,这个问题可能会变成小菜一碟。