<iframe align="top" marginwidth="0" marginheight="0" src="http://www.zealware.com/46860.html" frameborder="0" width="468" scrolling="no" height="60"></iframe>
Csdn Blog在2007年,由于访问量和数据量的大幅度增长,使得我们原有的在.text 0.96版本上修改的代码基本不堪重负。
在数据库方面主要表现为,单单文章表,2007年1年的数据已经达到了30G的量(最后的解决方案是对把文章表分为两个表,分别存放文章相关信息和专门存放文章内容的表,然后对两个表作分区)。熟悉.Text得朋友可能知道,有一个专门记录流量的表,页面内的每一次点击,直接记录到数据库里面,反映到页面上就是单个用户的博客流量,分别是EntryID,BlogID,DateTime,表名称叫做blog_viewcount,这个表我们现在已经到了4亿的数据,之前仅仅是优化索引和索引试图来在真实的环境中查看到底sql2005单表能负载多大的量。
最后得出结论,在sql2005中,单表的量最多不能超过200w数据。
而文章表和blog_viewcount这个表,我们现在采用2005得新特性,分区表来实现。事实上,反映还不错。以下写出创建分区表的步鄹(我们用blog_viewcount来做实例):
先根据表数据的量大小,来拆分每一个分区,保证分区之间在200w以下的数据
CREATEPARTITIONFUNCTIONOneYearDateRangePFN(datetime)
ASRANGELEFTFORVALUES
(
'2007013123:59:59.997',
'2007022823:59:59.997',
'2007033123:59:59.997',
'2007043023:59:59.997',
'2007053123:59:59.997',
'2007063023:59:59.997',
'2007073123:59:59.997',
'2007083123:59:59.997',
'2007093023:59:59.997',
'2007103123:59:59.997',
'2007113023:59:59.997',
'2007123123:59:59.997'
)
然后我们需要添加相应的文件组
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200701]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200702]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200703]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200704]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200705]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200706]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200707]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200708]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200709]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200710]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200711]
ALTERDATABASEnewcsdnblogADDFILEGROUP[ViewCount200712]
第三步,我们需要在服务器上建立出单独的文件(涉及到的朋友可能知道,我们如果把文件分布在不同的磁盘上,可以最大限度的提高磁头的读写能力;另:这里微软建议数据库服务器最好作Raid0 + Raid1)
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200701',FILENAME=N'f:SmallTableViewCount200701.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200701]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200702',FILENAME=N'f:SmallTableViewCount200702.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200702]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200703',FILENAME=N'f:SmallTableViewCount200703.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200703]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200704',FILENAME=N'f:SmallTableViewCount200704.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200704]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200705',FILENAME=N'f:SmallTableViewCount200705.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200705]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200706',FILENAME=N'f:SmallTableViewCount200706.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200706]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200707',FILENAME=N'f:SmallTableViewCount200707.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200707]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200708',FILENAME=N'f:SmallTableViewCount200708.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200708]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200709',FILENAME=N'f:SmallTableViewCount200709.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200709]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200710',FILENAME=N'f:SmallTableViewCount200710.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200710]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200711',FILENAME=N'f:SmallTableViewCount200711.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200711]
ALTERDATABASEnewcsdnblog
ADDFILE
(NAME=N'ViewCount200712',FILENAME=N'f:SmallTableViewCount200712.ndf',SIZE=5MB,MAXSIZE=100MB,FILEGROWTH=5MB)
TOFILEGROUP[ViewCount200712]
第四步,创建关联
CREATEPARTITIONSCHEMEOneYearDateRangePScheme
AS
PARTITIONOneYearDateRangePFN
ALLTO([PRIMARY])
第五步,创建表和索引(我这里只列出如何创建表)
CREATETABLE[dbo].[Blog_ViewCount2]
(
[EntryID][int]NOTNULL,
[BlogID][int]NOTNULL,
[ViewDate][datetime]NOTNULL
)
ONOneYearDateRangePScheme(ViewDate)
GO
如果大家希望查询此表中的相关数据,可以使用如下语句
select$partition.OneYearDateRangePFN(ViewDate)from[Blog_ViewCount2]aorderbya.ViewDateasc
关于增量问题,我会在下一篇文章中,和大家分享。
参考资料:
http://www.microsoft.com/china/msdn/library/data/sqlserver/sql2k5partition.mspx?mfr=true
http://www.builder.com.cn/2007/0724/436577.shtml
http://www.agilelabs.cn/blogs/woody/archive/2006/08/24/1574.aspx
http://net.stuun.cn/database/Mssql/jiqiao/39408.html
Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=1922538
分享到:
相关推荐
对海量数据的处理一直是一个令人头痛的...SQL Server 2005新增的表分区功能,可以对数据进行合理分区,当用户在访问部分数据时,SQL Server最佳化引擎可以根据数据的实体存放,找出最佳的执行方案,而不至于大海捞针。
SQL Server 2005数据挖掘与商业智能完全解决方案
超大型数据库的大小常常达到数百GB,有时甚至要用TB来计算。而单表的数据量往往会...所以对大表进行分区是处理海量数据的一种十分高效的方法。本文通过一个具体实例,介绍如何创建和修改分区表,以及如何查看分区表。
sqlServer数据库大表分区方案,新建表的时候。。如何表分区。
查看sqlserver表分区数据分布,需要的同学下载看看吧
SQL Server 2005数据挖掘与商业智能完全解决方案.iso SQL Server 2005数据挖掘与商业智能完全解决方案.iso
SQL Server 2005 中的分区表和索引
安装 sql server 2005 时 提示 “SQL server服务无法启动”解决方案
sqlserver2005表分区方案建设
FoodMart数据库是SQL Server以前版本所带的示例数据库,它模拟了一家大型的食品连锁店的经营业务所产生的数据。其商业数据保存在一个Access格式的数据库中,其中包括了客户管理数据、销售数据、分销数据和库存数据等...
MS SQL Server:分区表、分区索引 详解 1. 分区表简介 使用分区表的主要目的,是为了改善大型表以及具有各种访问模式的表的可伸缩性和可管理性。 大型表:数据量巨大的表。 访问模式:因目的不同,需访问的...
两台SQL-Server数据同步解决方案
SQL Server 2005数据挖掘与商业智能完全解决方案word版 SQL Server 2005数据挖掘与商业智能完全解决方案word版
此文档中详细的记载了,SQL Server 2005新特性之表分区的功能,希望可以帮下载的朋友们!
SQL server 2008 R2数据平台运维管理解决方案
SQL Server 在处理大型数据中,如果我们把安系统默认的格式,将所有数据都写到一个文件中,那么我们对数据的操作可想而知,效率决对是相当低的,为了让SQL Server也能处理大型数据,SQL Server 2005开始支持分区表,...
用SQL server 2005 建立数据仓库,大家不用在为“如何使用SQL server 建立数据仓库而纠结”。
此文档中详细的记载了,SQL Server 2005对海量数据的处理,希望可以帮到下载的朋友们!