第2015年第7期 (总第467期) 商 业 经 济 SHANGYE JINGJI No.7。2015 Total No.467 【文章编号】1009—6043(2015)07—0084—05 数据科学的发展 及其在客户细分中的应用 许获迪 ,江小蕾z (1.北京银行博士后科研工作站, 北京 100033; 2.北京工商大学经济学院, 北京 100048) 【摘 要】数据科学是从数据中提取知识的新兴学科,在科学研究的“第四范式”兴起的背景下被正式提出。用于商业决 策和科学研究的数据产生了根本性的变化,其特征从原来主流的抽样、结构化、小规模发展到全数据、半结构和非结构化、大 规模,驱动数据科学发展成为既包含传统统计方法,又包含数据挖掘、文本挖掘、过程挖掘和大数据等新兴技术的交叉学科。 客户细分是典型的数据导向的商业和研究领域,数据科学在其中的应用表明,该学科所包含的各种方法,能够成功提取复杂 的客户相关数据中蕴含的信息和知识,能够解决客户细分的可行性、有效性、精确性问题,为客户细分研究和商业实践提供良 好的技术支撑和决策支持。 【关键词】数据科学;客户细分;应用情况 【中图分类号】F22 一【文献标识码】B 引起广泛重视。2002年,国际科学理事会:数据委员会科 学和技术(CODATA)开始出版数据科学杂志。2003年,美 、引言 数据产生、搜集、存储和处理方式的进化催生了数据 爆炸时代,需要一门专门研究数据的各种类型、状态、属 性,组织形式、变化方式和规律的科学,揭示自然界和人 类行为现象和规律,为科学研究提供一种新的方法,为商 国哥伦比亚大学开始发布数据科学杂志,主要内容涵盖 统计方法和定量研究中的应用。 概括而言,数据科学就是从数据中提取知识。[31根据 业智能提供新的支撑。因此,数据科学的概念提出之后, 迅速在商业和研究领域引起重视,应用越来越广泛。 客户细分customer segmentation)是指根据客户属性划 Naur(1960)t41的观点,数据科学或称数据学是计算机科学 的一个替代性称谓。1998年,C.F.Je舯 u在题为“统计学 等于数据科学吗?”的演讲中,建议将统计学改名为数据 科学。但是这种字面上的转换,并没有将数据科学确立为 一分的客户集合【11。客户作为企业最为重要的战略性资源之 一,其需求的满足关系着企业生存、壮大和永续发展,为 一个独立的学科。Cleveland(2001) ̄首次将数据科学作为 个独立的学科提出时,将数据科学表述为统计学加上 了满足异质性的客户需求,制定相应的差异化管理策略, 企业广泛应用客户细分理论作为重要管理工具,该工具 它在计算技术方面的扩展。魏瑾瑞(2O1 4)旧认为数据科学 的理论基础是统计学,数据科学可以看作是统计学在研 究范围(对象)和分析方法上不断扩展的结果。朱扬勇 (2011) 则认为,数据科学目前只是多个相关学科“拼接” 起来的一个新兴学科,尚未形成完整的学科框架体系。 从以上观点可以看出,数据科学是一门新兴的交叉 甚至已成为全球使用率最高的lO大管理工具之一。[21 ̄ -效的客户数据分析是客户细分成功的关键。在客户细分 实践中,制约其发挥作用的因素已不再是客户数据信息 量的不足,而是对客户信息资源潜在价值的挖掘不够充 分。数据科学能够处理各种类型和规模的数据。充分利用 数据中蕴含的信息提取出有利于商业决策和科学研究的 知识,非常适用于客户细分这一依赖数据导向的领域。 学科,其真正的发展起步未久,正处在迅猛发展阶段。事 实上,第四范式即数据密集型科学的提出,极大促成了数 据科学的正式提出和发展。20世纪90年代中期,已故图 二、数据科学和第四范式 “数据科学”(Data Science)起初叫“datalogy”。最初在 1966年由Peter Naur提出。1996年,International Federa— tionofClassiifcation Societies(IFCS)国际会议召开,数据科学 一灵奖得主格雷(Jim Gray)阿 提出了科学研究的“第四范式 the fourth paradim)”g——数据密集型科学。不同于实验、 理论、计算这三种范式,“第四范式”下,需要“将计算用于 数据,而非将数据用于计算”,这种观点实际上是将数据 科学从计算科学中单独区别开来了。鄂维南院士(2013)罔 也提到“大数据在科学领域的表现是数据科学的兴起,数 词首次出现在会议(Data Science,classiifcation,andrelat— edmethods)标题里。数据科学的概念于20世纪在学术界 【收稿日期】2015-07-08 【作者简介】许获i ̄.(1983-),女,湖南长沙人,司职于北京银行博士后科研工作站。研究方向:国际贸易、金融; 江小蕾(1989-),女,山东烟台人,北京工商大学经济学院硕士研究生。研究方向:金融。 一84— 许荻迪。江小蕾:数据科学的发展及其在客户细分中的应用 据科学将成为科研体系中的重要组成部分,并逐渐达到 据指不用随机分析法(抽样调查)这样的捷径,而采用所有 与物理、化学、生命科学等自然科学分庭抗礼的地位”。 数据进行分析。 三、数据进化驱动数据科学产生和发展 2.多类型:文本挖掘和过程挖掘 如前所述,数据科学中的数据处理和分析方法是在 尽管各类数据处理技术的目标都在于从数据中提取 信息和知识,然而这些技术所能处理的数据范围不一样。 不同学科领域中分别发展起来的,包括数学、统计和信息 科技领域中的多种技术和理论,例如:信号过程、随机模 数据本身是一个很宽泛的概念,包括结构化、半结构化和 非结构化等类型。结构化数据即传统的关系数据模型、行 型、机器学习、统计学习、计算机编程、数据工程、模式识 数据,存储于数据库,可用二维表结构表示。半结构化数 别和学习、可视化、预测技术、不确定性模型、数据仓库和 据即自描述,数据结构和内容混杂在一起,例如XML、 高性能计算。数据科学特别关注扩展到大数据的方法,不 HTML等,可用树、图(数学中的定义是什么)等模型表示。 过普遍认为数据科学并仅限于研究大数据。总之,为了从 非结构化数据指各种文档、图片、视频/音频等,无法用 数据中提取更多的信息和知识,许多新的技术随着数据 数学模型表示。 特征的演化,被不断纳入到数据科学的范畴中。 统计学研究的数据虽然类型丰富,但都需要在前期 (__・)统计学 进行结构化处理,例如,统计学所使用的类别数据、有序 正如有些研究者认为数据科学是在统计学的基础上 数据等定性数据,定距数据、定比数据等定量数据,都是 发展而来的,统计学是数据科学包含的技术中最早的一 结构化数据。 类。1900年之前,统计学还未作为独立学科分离出来,当 文本挖掘、过程挖掘等数据技术能够处理以文本、操 时处理的数据主要是全国范围的普查登记造册,一般是 作记录等形式存在的社交信息、地理位置信息、行为习惯 一些简单的数据汇总和比较。大约在1920—1960年期间, 信息、偏好信息等各种维度的信息,从而最大程度上利用 统计学的关注焦点逐渐缩聚在小规模数据(样本),产生了 以前无法利用的记录对人类行为数据进行分析,使得能 经典的统计方法,即统计推断;以及现代意义上的统计调 够分析的数据范围迅速扩大。数据科学通过纳入这些新 查,即抽样调查。随后,统计方法得以广泛应用,并得到了 的数据处理技术,使得能处理的数据范围更为宽泛,不仅 快速发展。【l】1统计学处理的数据是抽样得来的、结构化 包括这些传统的结构型数据,而且还包括统计学无法处 的、相对小规模的。 理的文本、图像、视频、音频、网络日志等非结构型和半结 (二 )数据科学在统计学之外的发展 构型数据『l31。总体而言,数据科学对于数据结构的要求大 真正意义上的现代统计学是从处理小数据、不完美 大降低了。 的实验等这类现实问题发展起来的旧,而数据科学则是 3.大规模:大数据 由于另一类现实问题而兴起——全数据、半结构和非结 随着技术的进步,人类开始可以巨细无遗地记录一 构、大规模记录中蕴含的信息需要被充分挖掘从而产生 切可以记录的数据,数据规模急剧增大,数据量实现了从 更大价值。 GB级到PB级的跨越,人类进人大数据时代。大数据又称 1.全数据:数据挖掘 为巨量数据 gdata,megadata),呈现出4V特点:Volume(大 随着数据化时代的到来,针对需要研究的问题常常 量)、Velocity(高速)、Variety(多样)、Value(价值),是需要新处 可以得到数据总体,数据收集方式的改变直接淡化了样 理模式才能具有更强的决策力、洞察力和流程优化能力 本的意义。现代统计分析方法的核心是抽样推断(参数 的海量、高增长率和多样化的信息资产。㈣ 估计和假设检验),即在观察了样本的情况下如何去推 由于无法确定哪些数据是绝对无用的,选择部分数 断总体。 据进行删除的风险要大于存储大量数据的成本。既然难 然而在全数据的情况下,推断就失去了原有的价值。 以通过删除缩小数据量,传统的关系数据库又不具备应 例如一个公司的数据库中可能有所有员工和客户的资 付数据量急速膨胀的伸缩性和扩展性,也不具备快速、有 料,去年所有业务的记录等。年度业务的平均值不再需要 弹性地对大数据进行查询、计算、统计分析的能力,需要 通过统计推断得到,而是可以通过直接计算全体数据的 发展新的技术以专门处理大数据。 平均值,此时观测到的值也就是估计参数。同时,数据的 大数据技术包含更高效率的存储工具,具备显著的 数量增长可以带来质量提升,即所谓的“大量的数据胜于 伸缩性和扩展性,可以很好地适应数据量的快速膨胀,可 好的算法”。更何况在某些情况下,例如社会网络数据,抽 以通过简单增加计算机来无限地扩充存储能力;也包括 样本身是存在困难的。 高级查询语言,对现实中的数据格式具有弹性和适应性 因此,在能够获得全数据的情况下,使用数据的全体 俳固定格式),并能在可容忍的时间范围内完成一系列数 是更为可取的。数据挖掘作为一种能够处理全数据的方 据处理过程。由于大数据分析能够解决其他技术没能提 法,在很多情形下,使得模型的发现更为容易,从而成为 供解决方案的海量数据存储和计算的可行性和有效性问 数据科学中一类重要的方法。继数据挖掘之后,另一个能 题,该技术被充实到了数据科学中。 处理全数据的技术是大数据方法,在维克托・迈尔一舍恩 f三)数据导向:算法和模型 伯格及肯尼斯・库克耶编写的《大数据时代》中提出,大数 数据导向在第四范式的浪潮下,已经被越来越多的 一85— 商业经济第2015年第7期 SHANG ̄qE 3]ING3][No.7.2015 研究者和管理者所认同。但是数据导向仍然有基于模型 与基于算法两种声音t堋,基于模型的方法假定数据背后 存在某种生成机制,其基本观点是,得到的模型不仅要正 确(即可解释性强),而且要准确(即外推预测能力强)。 基于算法的方法认为复杂的现实世界无法用数学公 现在对于客户停电损失(CIC)最终估计的离差减小了。 国内学者对聚类分析在客户细分研究中的应用也进 行了一些探索。季月江和吕佳(2oo9) ̄”主要分析了 K—means算法及其在客户细分中的应用,并指出客户价 值、消费特征和人口特征这三个维度是客户细分的主要 式来刻画,对于现实中复杂的、高维的、非线性的数据集, 不设置具体的数学模型,不进行函数机制的探讨,对数据 也不做相应的限制性假定。在很多应用场合,算法模型得 内容。吴军英和辛锐(2010)t-噬于K—meal'lS算法和基于密 度的DBSCAN算法的优点和不足提出了改进的DBSK算 法,使得算法对全局参数依赖性降低,并应用该算法进行 客户细分。熊云波(2oo8) ̄为客户细分是客户关系管理 的核心,并运用聚类分析技术对零售业客户进行客户细 分的实证研究。徐昆(2014)ml改进了K—means算法,参考 RFM模型设立指标对客户进行细分,并通过编程优化 到的是针对具体问题的解,并不是统计意义上的推断解。 算法模型的可解释性较弱,但是对数据分布结构的限制 性假定更少,而且在计算效率上有很大的优势,可扩展性 也更强。 20世纪80年代中期以来,算法模型随着计算机技术 的迅猛发展而得到快速成长,然而很大程度上是在统计 学这个领域之外“悄然”进行的,比如人工神经网络、支持 向量机、决策树、随机森林等机器学习和数据挖掘方法。 K—means算法宏程序,对快速消费品的销售历史数据进 行了实证分析,以实现资源的优化配置。 (二)人工神经网络 人工神经网络(Artiifcial Neural Network)是一种类似于 大脑神经网络结构和功能的数学模型。它是由一系列的 处理单元利用适当的方式互连而成的一个非线性信息处 算法模型以其天生与计算机的相容性,越来越受到学界 的广泛重视。数据导向的、基于算法的数据分析方法成为 无法回避的一个重要趋势。 理系统。口4该方法是一种人工智能算法,也是一种数据挖 掘技术,具有自适应性、自组织性、容错性等特征,能够快 速、准确实现智能化分析,并对未来做出预测和评价,在 模式识别、数据处理及自动化控制等多个领域的应用都 取得了良好效果。阅 国外很多研究将人工神经网络方法应用于客户细 四、应用数据科学的客户细分研究 客户细分与数据有着天然的紧密联系,科学准确地 细分客户需要依靠数据,同时,企业在当前的技术环境 下,又能够提供大量的、各种类型的、关于客户的全数据。 采用数据科学中各项技术,能够从不同角度充分利用这 分。Ali,J.和Rao,C.P.(2010) ̄在信息处理和通信技术不断 改进的基础上探索更加有效的市场细分的方法,并详细 阐述了神经网络模型的可行性。Kauko,T.等(2002)r ̄采用 两种神经网络模型——自组织映射(SOM)及学习矢量量 化(LVQ)模型对芬兰赫尔辛基的房地产市场进行细分,发 现客户更关心地理位置和房屋种类,房屋价格反而是较 少被考虑的因素。Derrick S.Boone和Michele Roehm(2002) 些数据中蕴含的信息,立体完整地勾勒出每一种客户群 体的各项特征。 目前比较典型的应用于客户细分的数据科学技术有 聚类分析、人工神经网络、文本挖掘等,应用这些技术可 实现不同内容、维度和侧重点的客户细分,研究结论对商 业实践有很好的参考作用。 (_一)聚类分析 聚类分析是将数据对象依据其特征分组成若干个类 或簇的一种数据挖掘技术。簇是一组数据对象的集合,同 一于模糊人工神经网络分析技术,采用真实数据检验会 员聚类准则,在现有方法的基础上确定目标市场细分区 间,并验证不同市场细分的优势。Velu,C.M.和Kashwan,K.R. (2015)r ̄于人工神经网络的智能模型,采用目标市场客户 的实际交易数据,研究客户的消费行为并将客户进行分 类。 国内许多学者对神经网络方法进行了改进,并将其 个簇中的对象彼此相似,不同簇中的对象彼此相异。it日 许多国外研究都将聚类分析应用于客户细分研究。Fe卜 reira Lope(2009)tt 强调联合分析和聚类分析在客户细分中 的优势,通过聚类分析了解消费者偏好,并据此将客户分 组,制定更有针对性的营销策略。Simunaniemi A—M等 应用于客户细分研究。陈伯成(2004) 寸自组织神经网络 在客户分类中的应用进行了探讨,在讨论客户细分相关 概念的基础上,给出一种基于SOM客户分类方法,并根 据综合指标的计算和各个指标的相对结果将客户分类, 进行模拟计算。施扬(2007)t3tl应用自组织特征映射SOM的 人工神经网络模型对客户高维数据进行训练,得到的分 (2013)t 81采用半结构式问卷调查方法,运用两步聚类分析 法对消费者的饮食习惯进行分析,对客户集群进行基于 T检验及卡方检验的比较,证实聚类分析能够有针对性 的对消费群进行健康和营养指导。0.Dzobo等(2014)o9 ̄介 绍了在电力系统领域客户细分所具备的价值,采用层次 聚类技术从电力产业的经济规模、经济活动以及能源消 费方面对客户进行细分并进行了案例分析。Henriet— 类模型能够对商业银行CRM系统在线实时输入的客户 信息进行有效分类。秦昌磊和薛亚菲(2010)rm- ̄:用自有神 经网络(SOM)建立银行客户细分模型。汤亚玲等(2014) 睁 遗传算法与BP神经网络结合用于对银行客户分类进而 对客户购买银行产品的行为进行预测,发现基于自适应 teM ti ller等(2014) ̄为电力系统稳定性分析建立了多维度 客户细分模型,采用规模、经济活动、能源消费量三个变 量将客户依照其负荷特性进行细分,对南非和瑞典数据 的分析表明,该模型相对传统客户细分模型的有效性体 一的遗传神经网络方法能够更快更高效分类银行客户。 86一 许荻迪,江小蕾:数据科学的发展及其在客户细分中的应用 (三)文本挖掘 决策和科学研究的数据产生了根本性的变化,其特征从 文本挖掘也称为文本数据挖掘或文本知识发现,是 原来主流的抽样、结构化、小规模发展到全数据、半结构 指从大量文本数据中抽取事先未知的、可理解的、最终可 和非结构化、大规模,驱动数据科学发展成为既包含传统 用的知识的过程,同时运用这些知识更好地组织信息。直 统计方法,又包含数据挖掘、文本挖掘、过程挖掘和大数 观地说,当数据挖掘的对象完全由文本这种数据类型组 据等新兴技术的交叉学科。同时,在数据导向的思想下, 成时,这个过程就称为文本挖掘。嗍文本挖掘的基本思想 数据科学也体现出从偏重模型到偏重算法的趋势。 是首先将文本进行切分,进行信息抽取,将非结构化文本 客户细分是典型的数据导向的商业和研究领域,数据 数据利用分类、聚类、关联分析技术转化为结构化数据, 科学在其中的应用表明,该学科所包含的各种方法,能够 然后根据结构化数据发现、获取信息之间的关系,并进行 成功提取复杂的客户相关数据中蕴含的信息和知识,能够 趋势预测。阁口固文本挖掘作为数据挖掘的热门领域受到了 解决客户细分的可行性、有效性、精确性问题,为客户细 政府、商业和研究机构的广泛关注p回,但该方法应用于客 分研究和商业实践提供良好的技术支撑和决策支持。 户细分研究才刚刚起步,具有重大的发展潜力。 【参考文献】 国外研究者将文本挖掘技术应用于客户细分,着重 【1】(美)菲利浦・科特勒.新千年市场营销发展趋势[J】.销售 研究了客户蕴藏于文本中的态度、情感、观点等内容。 市场,2001(1):5—8 ParkJ.等(2014) 使用文本挖掘识别“纤维肌痛临床特征患 [2lRigby D K.Management Too1s 2001 Global Results:Annual .者fFM)”网上发布的内容,对医疗客户进行细分。通过识 Survey of Senior Executives[R】.BAIN&COMPANY In- 别、分析FM网站有关记录的词性、词频、语法及短语,获 cReseareh Report,2002:1-4 得FM客户的关键词。关键词显示,疼痛是FM患者最关 【3]Dhar,V.(2o13).”Data science and prediction”.Communi— 注的问题:疼痛部位主要在肌肉、腿、脖子、后背、关节及 cations ofthe ACM 56(12):64.doi:10.1145/2500499.;Jeff 肩膀等位置;疼痛症状可分为“严重”、“长期”、“经常”三 Leek f2013-12-12).”The key word in”Data Science”is 类,同时可能伴随痉挛。客户还关注医疗服务和其他帮 not Data,it is Science”.Simply Statistics 助,并且希望病痛尽量少地影响职业和人际关系。研究结 DIP Naur.Report on the algorithmic language ALGOL 60【RI. 果表明,通过文本挖掘可以客观地了解FM客户关注的 Comm.ACM,1960(5):299—314 问题并对其进行细分。Sun等(2015) q指出,为YouTube和 [5】w Clevelnad.Data science:na action plna for expanding hte Flicker等社会媒体网站的客户提供适当的个性化推送内 technical areas of hte ifeld of statistics[J1.International 容变得越来越有挑战性,而文本挖掘能够有效地应对这 Statistical Review,2010(I):21-26 一挑战。协同过滤(occ ̄方法通过整合在线情感文本来 [6】魏瑾瑞,蒋萍.数据科学的统计学内涵[J】_统计研究,(31)5: 建立细分和推荐模型,能够改善传统推荐模式过于依赖 3-9 优先等级并且经常遇到数据稀缺性的问题。该研究结合 [7】朱扬勇,熊赘.数据学与数据科学发展现状[EB/OL].http: 推断的情绪反馈信息和OCCF模型,开发了新的社交媒 //www.paper.edu.cn/eleasepaper/content/201 1 06 329, 体推荐模型SA_OCCF,对网站客户进行细分和针对性内 201 1-06-16 容推送,研究结果表明该推荐模型比OCCF更加有效。 [8】赵国栋,易欢欢,糜万军,鄂维南.大数据时代的历史机 OdedNetzer等(2012)嗍提出,在Web2.0时代,对于博客、论 遇:产业变革与数据科学[M】.清华大学出版社,2013 坛、聊天工具所记载的用户想法、信念以及经验形成大量 [9】C Lynch.Jim Gray’8 Fourth Paradigm nad hte Construction 文本数据,可通过文本挖掘方法,结合语义网络分析,从 fothe Scientfic Record【A】 中搜集分析客户对竞争对手产品的态度,将其转化成市 【10 Hey,S Tansley,K Tolle.The Fourth Paradigm:Da_ 场结构及竞争格局相关信息。 ta-Intensive Scientiifc Discovery【C】.Microsoft Research, 国内研究者采用文本挖掘进行客户细分,主要发掘 2012:177—185 客户特性和行为偏好。胡雨晴(2014)4tq针对短文本数据, 【1 1】R Groves.Three eras fo Survey R esearch[J].Public Opin- 研究文本数据的维数约减方法和基于文本聚类的客户细 ion Quarterly,201 1(75):861-871 分问题,发现了关注人群的分布情况以及不同的客户行 [12]The best source fo g0od sattistical work is bad experiments, 为偏好。庞观松(2013)t4 提出,客户的社会关系网的兴趣 J0hn Mount,2013. 爱好信息对客户特征描述具有重要意义,该研究采用微 [13]郑京平,王全众.官方统计应如何面对BigData的挑战 博平台文本数据,探索了社会关系特性在客户细分中的 [J].统计研究,2012(12):3—7 作用,将客户个人和社会特性两个方面结合生成客户特 [14]大数据分析技术的发展[EB/OL].2012—05—16.http: 性描述文本。 //tech.ceidnet.com/art/32963/20120516/3859799——1.html 【15]L Breiman.Statistical Modeling:The Two Cultures[J].Sta— 五、结论 tistieal Science,2001(3):199-23 1 数据科学是从数据中提取知识的新兴学科,在科学 [16】吴军英,辛锐.聚类分析在客户细分领域中的应用[J].微 研究的“第四范式”兴起的背景下被正式提出。用于商业 计算机信息,2010(28):199—200+207 —87— 商业经济第2015年第7期 SHANGYE JINGJI No.7。2015 Market Forcaseting[J】.International Journal of Advance— ments in Computing Technology,2015,71 [1 7]Ferreira Lopes,S 6 rgioDominique,RilBoubetaa,Antonio, Varela Mallou.Jes丘S.Post Hoe Tourist Segmentation with Conjoint and Cluster Analysis[J].PASOS:Revista de Tufts— mo Y Patrimonio Cultural,2009:73 [3Ol陈伯成,梁冰,周越博,林析泉,赵延.自组织映射神经网 络(SOM)在客户分类中的一种应用[J].系统工程理论与 实践,2004(3):8—14 【18]Simunaniemi A—M,NydahlM,Andersson A.Cluster naalysis of fruit and vegetable—related perceptions:an alternative 【3 1】施扬.基于SOM的商业银行客户分类管理模型研究 [J].科技广场,2007(12):103—106 【321秦昌磊,薛亚菲.基于SOM的商业银行客户细分研究 [J].现代商业,2010(6):27 approach of consumer segmentation.[J】.Journal of Human Nutrition and Dietetics,2013:261 【19]Henriette M if ller,Ulrich Hamm.Stability of market seg- mentation with cluster analysis—A methodological ap- [331汤亚玲,黄华,程泽凯.基于自适应遗传神经网络的银 行客户分类研究[J].计算机技术与发展,2014(7): proach[J].Food Qualiy tnd aPreference,2014:34 【20]Dzobo,K.Alvehag,C.T.Gaunt,R.Herman.Multi—dimen— 192-195 sional customer segmentation model for power system relia- [341 ̄J建国.试论文本挖掘及其应用[J]_图书馆学研究,2008 bility-worth analysis U】.International Journal of Electrical (4):22-24 Power nad Energy Systems,2014,62 【35]康东.中文文本挖掘基本理论与应用【D].苏州大学, 【211季越江,吕佳.基于聚类分析的客户细分研究【J】.办公自 2Ol4 动化,2009(8):36—39 [36】刘智勇.基于云计算的文本挖掘算法研究【D】.电子科技 【22】熊云波.聚类分析在客户细分中的应用[J】.科技资讯, 大学。2011 2008(34):224 [37]Park J;Cogege of Humanities,Ajon University,Suwon—si, 【23】徐昆.优化的聚类分析在企业客户细分中的应用[J].经 Koera.,Online discourse on ifbromyalgia:text-mining to i— 济论坛,2014(1):123—128 dentify clinical distinction and patient concerns.【J】Medical 【241黄华.基于神经网络模型的银行客户分类研究【D】.安徽 Science Monitor:.International Medical Journal Of Experi- 工业大学,2014 mental And Clinical Research【Med eSiMonit】2014 Oct 07; 【25】施扬.基于SOM的商业银行客户分类管理模型研究 Vo1.20,PP.1858-64.Date of Electronic Publication:2014 【J】.科技广场,2007(12)103—106 Oct07 [26]Ali,J;Rao,CP,Neurla networks model:A vibale approach [38]Sun,JinashanWang,GanSCheng,XusenFu Yelin,Mining ofr micro market segmentation,[J].Summer Marketing Edu- affcetive text to improve social media item recommendation cators Conference of hte American-Marketing-Association, 【J]Information Processing&Management.Ju12015,Vo1.51 2010:320-321 Issue 4,p444—457.14p [27]Kauko,T;Hooimeijer,P;Hakfoort,J,Capturing housing [39]OdedNetzer, Ronen Feldman,Jacob Goldenberg and market segmentation:An alternative approach based on Moshe Fresko,Mine Your Own Business:Market—Structure neurla networkmodelling[J].HOUSING STUDIES,2002,17: Surveillnace Through Text Mining[J].Marketing Science, 875-894 Vo1.31,No.3,Emergence and Impact of User-Generated 【28]DerrickS.Booneand Michelle Roehm,Evaluating hte Ap— Content(May-Jnne 201 2):521-543 propriateness of Market Segmentation Solutions Using Arti- 40】胡雨晴.基于文本聚类的客户细分方法研究[D】.江苏科 ifcial Neural Networks and the Membership Clustering Cri- 技大学,2014 teflon[J].Marketing Lettem,2002:3 17-333 [411庞观松.基于文本分类技术的微博平台潜在客户挖掘 【29]Velu,C M,Kashwan,K R.Artificila Neural Network Based 【D].广东外语外贸大学,2013 Data Mining Technique for Customer Classiifcation for 【责任编辑:王凤娟】 (上接第75页) 【2】郑胜华,张芳.浙江省旅游产业整合的现状及其对策[J]. 用。在这种严峻的形势下,建立人力资源发展与稳定策略 首都经济贸易大学学报,2003(1):73—76 很有必要。 【3】袁尧清.湘西地质旅游资源群旅游发展的空间效应及 连山旅游目的地应积极加强与专业院校、旅游公司、 整合开发模式研究【M】.长沙:湖南人民出版社,2O14— 知名景区合作,通过引进、送学、培训等方式,加大对旅游 08:251-289 人才的培养、选拔、储备力度,使旅游人才队伍逐步实现 [4]蔡琴.湖南环洞庭湖区域旅游资源整合研究【D1.华东师 知识化、专业化、年轻化、正规化。 范大学,2010 【参考文献1 【5】瞿春林,阳国胜.炎帝出生地新说——炎帝故里在会同 【1]t欣,吴殿廷,方修琦,肖敏.旅游资源整合新论【J】.桂林旅 【J】.船山学刊,2006(4):76—78 游高等专科学校学报,2005(4):29—33 【责任编辑:潘洪志】 —88一