mysql索引浅析

谈起索引,首先简单的介绍一下Mysql的存储引擎。

1. Mysql有多种存储引擎,像

MyISAM、InnoDB、MERGE、MEMORY(HEAP)、BDB(BerkeleyDB)、EXAMPLE、FEDERATED、ARCHIVE、CSV、BLACKHOLE。 (更多…)

让成交飞 量子统计销售数据能告诉你的网店秘密

量子销售分析功能客户实例分析:销售数据能告诉你的网店秘密!

有人说,在电子商务的王国,谁拥有数据,谁就先人一步。今天,我们就通过实际案例来说说店铺销售数据的事儿。
很多淘宝的卖家认为,销售数据不过是成交额这样简单的数字,给老板用来看看店铺赚的钱数就够了。其实销售数据中隐含着许多的秘密,能帮助你提升经营,让大家的网店成交真正给力地飞起来。

皇冠女装店的经营提升困局
店铺类型:女装/女士精品
店铺级别:5皇冠
开店时间:2008年3月
店铺问题:有了流量,也有了一些老客户。下一步,如果想要做的更好,我们该做什么呢?要提升哪方面呢?

店铺诊断及建议过程:

销售数据中的核心公式 销售额=访客数*成交转化率*客单价

第一步:店铺的基本销售数据告诉我们什么?

和我们每年一度的体检一样,要了解自己店铺的健康状况。首先得了解基本的“身高体重”等等基础指标。
首先,我们查看了这家女装店铺在淘宝开始大热促销的12月的“身高体重”。
在这个表格中,我们可以看到哪些信息呢?

我们看到在整个12月有190,3541个的淘宝卖家到访了该店铺,每个人平均点了2.12次页面,共产生了629,2620次浏览;这其中有5,4042个买家下了单,共买了9,2703件商品,花费了540万的人民币,平均每个客户花费了114.47元。店铺的成交能力是1.38%,也就是说平均每100个来访,会有1.38个客户成交。
这些数据告诉了我们什么呢?它告诉了我们店铺的基本信息,但是如果没有对比,我们很难找给出下一步的判断。所以我们在了解了基本情况后。要进入店铺诊断的第二步了——店铺对比。

第二步:通过核心公式判断店铺短板

基本的体检只能了解自己的健康状况,而要知道自己应该加强哪个部分的锻炼,注意哪个部分的身体状况就必须要拿出核心指标和别人做对比才能知道。很多淘宝卖家,不知道该怎么去找合适的对比对象,也不知道怎么拿到人家的数据。其实在量子的销售分析当中,有一个非常给力的功能,叫店铺经营对比,它根据类目和级别进行卖家划分,给出了帮助卖家去比对的数据标准。绝对值得掌柜们好好研究一下。
回到我们今天要体检的这家店铺,我们使用了量子统计销售分析当中的店铺经营对比数据,提取了该店铺的三大核心数据指标——成交转化率、客单价、访客数进行比对。我们发现:
该店铺在访问量方面和同级别店铺相当甚至略高,但是有两项核心指标明显偏低,一是成交转化率低于同类同级别店铺,除21日大促期间外,该店铺的成交转化只有1%多,同级店铺的成交转化率大概在3%。客单价大约在120-140左右,而同级店铺的客单价在170左右。而正是这两项指标决定了店铺的利润率高低。所以我们判断这个店铺的短板是成交和单价。

那么如何再通过数据进一步判断成交转化率在哪里出了问题呢?我们首先查看了这家店铺的来源构成数据,发现在来源构成当中,广告引入的客户占比相对较大。而广告投放的时候使用了大量的热门关键词。比如“韩版”等等。导致入店的客户相对身份比较杂,没有直接匹配到店铺外贸精品的定位上。所以我们建议该店铺在广告投放时,选用更加有店铺特色同时也能吸引客户的图片,在文案描述上也谨慎使用超级热门词。
当然来源不匹配只是导致成交转化率低的一个原因,要详细的而分析一个店铺的成交情况,还需要对老客户回头率、成交宝贝和浏览宝贝的对比等等数据进行进一步的分析。这里就不一一赘述。每个店铺都可以依据自己的情况进行分析,找到适合自己店铺的转化规律。总之,销售数据当中埋藏着很多有趣的秘密数据,等待大家去挖掘和使用。

转化率TIPS
通常影响成交转化率的因素有:
宝贝(时令宝贝)图文细节有吸引力;
相比同类宝贝,价格、运费便宜;
相比同类宝贝,店铺信用等级较高、客服服务到位、买家评价较好;
店铺装修、页面布局较好。
客单价TIPS
通常情况下影响客单价的因素有:
搭配销售、回头客营运效果好;
每用户购买的宝贝数量越多;
价格较高的宝贝销售好。

第三步 怎么选爆款?这也能靠数据!

这家女装店铺同样还有一个困扰,有时候好不容易报名了一个活动,好不容易有一个推广的机会,该选择推哪一款宝贝?价格低的,款式未必会被接受。之前卖得好的,不知道是不是还有继续推广的爱案例。那么到底该怎么选宝贝呢?其实这件事,也完全可以交给量子来帮忙。这就好比要选一个最好的水果,量子里提供了不同水果的重量、色泽度、口感等等数据。然后各位卖家只要去做个选择就OK了。
这么说好像比较抽象,那么就抽其中一个小小的数据图跟大家说明。这是该店铺在1月份的宝贝排行。这个排行综合展现了7个不同维度的宝贝指标。足够大家去观察和选择了。比如下图中我们根据收藏量进行了排行,就会发现打底裤这个宝贝收藏很高,再查看了成交和浏览的排行,它也是排在前4名,同时再查询了该宝贝的跳失率情况,数据为34,72%,低于其他宝贝的跳失。那么这一款就比较适合去做促销和推广。

当然,每家掌柜都会有自己选择爆款的标准和方式,有另一家皇冠女装店铺,就总结出自己的爆款筛选公式,主要标准就是宝贝收藏量高、宝贝被访问时间高,宝贝跳失率低。根据这样的规则,他们甚至创造过日销50W的单品奇迹。
以上三步,是我们给这家女装店铺的一些小小的分析和解读。其实除了以上介绍的指标外,零成交宝贝、促销数据、买家数据等等都被很多掌柜们用的活灵活现。我们特别想各位卖家分享的是,数据化运营是未来电子商务的趋势,谁先懂得数据,谁就占有这一轮的先机。从今天开始,用数据,去给你的店铺做体检吧!!!

开店2个月流量破百—将流量变成交易量

这是一个开店两个月卖家写的分享帖~从开店伊始就用量子统计(淘宝官方版)来观察店铺的数据,体验店铺的成长,值得我们学习学习~

我是一个小卖家啊!没钱进货,又禁不起压仓的风险,于是就选择了做代销。我的店铺申请时在2010年10月27号,正式开展是在2010年11月,所以现在算来开店也才2个月左右。这个2个月一直潜心做淘宝,也算有点心得了所以写下来和大家交流交流。

一、如何增加店铺浏览量

相信刚开店的卖家,如果资金不太充裕的,肯定还是用扶植版的旺铺吧,自然也没有采用一些营销工具。这个时候可能你店铺的浏览量几乎为零,这还得多谢量子统计官方版呢。自从开店以后,我是天天关注量子统计啊,每天一早起来先看量子昨天来了多少人,每天睡觉前也要看量子今天来了多少人。还记的我第一次浏览量突破100是在12月30号 那个叫激动啊!从我的量子看我从0到100可是进过了很长一段的努力哦!

第一步:每天打理店铺是我必须要做的事情。装修店铺,店铺里宝贝排列的顺序,显示的个数 我的非常仔细的研究,究竟怎样才能让顾客看而不腻,一下子就找到他们想要的商品。所谓工欲善其事必先利其器,只有把门面装修好了才能,理直气壮的把自己的店铺推销给别人对吧。
第二步:铺天盖地做宣传,我是小卖家,不可能一开始就花钱做宣传。所以只能苦了我的那些同学们了。在群里发我店铺的地址那是必然的啦。还有你要用尽一切可以宣传的手段。校内网、开心网、各大论坛啊等等。这一点可以从量子统计里的入店来源就可以看出来了。我记得开店初,我的浏览量才20几 而且一半是直接访问的,那些都是我同学帮我点的啦。还有一些事其他来源,我一点才发现是校内网的,后来还有一些帮派来源和淘宝类目搜索。就这样我的浏览量渐渐的增加了。这自然和第一步的基础建设分不开的。你看看我评价访问量已经达到90咯,最高的时候有149个人看过我的店。虽然和冠级的店家们没法比,但是我已近很心满意足了。

第三步:那就是如何保持并稳步增加浏览量了。这一点非常的难,要在前两步的基础上,增加你的曝光量。我只能谈谈我的方法了,首先你要看客人的访问时间,很明显的看出早上9点-12点 晚上8点以后,客人最会光顾我的店铺,那么你这段时间必须保持旺旺在线,其次将你宝贝上传的时间尽量选择在这么一个黄金时段上传。这样客户更容易收索到你的宝贝,自然你的曝光量也就提高了。

二、如何将曝光量转化为交易量

讲完了如何提高曝光量,就应该说说如何才能把曝光量转化成交易量,我相信这也是卖家们最关心的话题。这一点我也要非常谢谢量子统计官方版啊,是它专业的数据统计让我几乎打造了一款爆款产品。我这话可不是给量子统计做广告哦,我有事实依据的。

宝贝访问量排行,
看上面的图卖家们有没有看出端倪呢!我的被搜索到产品中排列第一的是伊暖儿usb加热饭盒。
这说明什么呢。这说明很多人要这一款产品,起码很多人搜索这一款产品,可是这么多人搜索为什么没人卖呢?不知道大家有没有思考过这个问题,我觉得有一下几个原因:第一你的产品名称描述不够好,第二你的价格比别人的高,第三你的宝贝描述不够详细。
针对上面这三个问题我采用了3个解决的方法,终于造就了我的爆款产品,
第一步:我在产品名字中加入了“特价”和“正品授权”、“假一罚十”关键字。这样就可以吸引人点击和询问你的产品,这样你就成功了第一步。
第二步:参考一下同类产品的价格,你的价格不能太高也不能太低,尽量达到适中的水平,大高的价格容易吓走客户,太低呢有容易让客户起疑心。
第三步:完善你的宝贝描述,这里说的宝贝描述不单单是指你对宝贝的特写。更多的是再客户询问当中的一些常见问题,你要在宝贝描述中提到。先这款加热饭盒 客户最常问的问题就是它安全吗 ,这对这个问题我特别注明了该产品有 CE和ROSH的专业出口证书,让客户一目了然。这样也可以为客户提供方便。还有客户经常提到包邮的问题,我也直接在宝贝描述中指明不能包邮,减轻自己的工作量。当然你也可以模仿一下其他产品的宝贝描述比如加上客户好评的截图,增加客户的信心。
这三步基本上让我增加了很多订单,如果您要开车或者做促销,量子统计宝贝访问量的数据,可是你很好的参考标准哦。我相信如果你做直通车,肯定会选择排名第一的宝贝,因为他本身就是一款客户关注的产品,如果在更多的地方被见到,自然成交量就高了。

三、感谢量子统计这两个月的相伴

开店2个月了,现在每天必做的事情就是看量子统计啦,现在我朝着破200的目标挺进着。多亏了量子让我在两个月内不花任何钱 已近升到5心的等级了,交易量已近是151笔,就等各位客人们的好评咯呵呵。我相信量子统计官方版,还有很多功能有待开发,我会一直关注它,从中得到更多的信息。然后分享给大家。

By heipinihao

量子统计推出“我的量子日记”活动

数据如何帮助店铺成长?积累是硬道理!
每一个访客的浏览,每一次流量的变化,每一件宝贝的被访,每一笔成交的出现……
只有日积月累的记录,才会看到店铺的成长,也能及时发现经营的不足。

因此,在2011年的开年,量子统计(淘宝官方版)推出“量子数据日记”活动。每一位在淘宝开店同时使用了量子统计的掌柜,都可以在量子帮派中开自己的独家主贴。每天记录自己店铺的数据情况,比如这个月流量一路平稳上升啦,这个月UV比上个月UV多啦,做了推广成交额增长啦。和大家一起分享自己的成长。同时量子的数据分析师也会一路跟踪大家的数据,定期给出建议。

各位掌柜还有机会获得量子的特别扶持机会。

日记的写作方法:

1、请各位量仔在量子帮派-【我的量子日记】版块单独开贴,帖子标题请以【我的量子日记】开始。
2、一个掌柜请只开一个主题帖,更新内容时在自己的主题帖中回复即可
3、可以使用本贴的头图作为自己主贴的头图,并修改ID为自己店铺的ID。
4、更新数据时,请在回复楼的起始位置插入右边标志,以区别您的回复和其他人的回复。

【我的量子日记】之517运动——顶级篮球战靴供应商
【我的量子日记】我和量子不得不说的故事

详情请关注量子统计官方帮派>>

剖析 epoll ET/LT 触发方式的性能差异误解(定性分析)

平时大家使用 epoll 时都知道其事件触发模式有默认的 level-trigger 模式和通过 EPOLLET 启用的 edge-trigger 模式两种。从 epoll 发展历史来看,它刚诞生时只有 edge-trigger 模式,后来因容易产生 race-cond 且不易被开发者理解,又增加了 level-trigger 模式并作为默认处理方式。

二者的差异在于 level-trigger 模式下只要某个 fd 处于 readable/writable 状态,无论什么时候进行 epoll_wait 都会返回该 fd;而 edge-trigger 模式下只有某个 fd 从 unreadable 变为 readable 或从 unwritable 变为 writable 时,epoll_wait 才会返回该 fd。

通常的误区是:level-trigger 模式在 epoll 池中存在大量 fd 时效率要显著低于 edge-trigger 模式。

但从 kernel 代码来看,edge-trigger/level-trigger 模式的处理逻辑几乎完全相同,差别仅在于 level-trigger 模式在 event 发生时不会将其从 ready list 中移除,略为增大了 event 处理过程中 kernel space 中记录数据的大小。

然而,edge-trigger 模式一定要配合 user app 中的 ready list 结构,以便收集已出现 event 的 fd,再通过 round-robin 方式挨个处理,以此避免通信数据量很大时出现忙于处理热点 fd 而导致非热点 fd 饿死的现象。统观 kernel 和 user space,由于 user app 中 ready list 的实现千奇百怪,不一定都经过仔细的推敲优化,因此 edge-trigger 的总内存开销往往还大于 level-trigger 的开销。

一般号称 edge-trigger 模式的优势在于能够减少 epoll 相关系统调用,这话不假,但 user app 里可不是只有 epoll 相关系统调用吧?为了绕过饿死问题,edge-trigger 模式的 user app 要自行进行 read/write 循环处理,这其中增加的系统调用和减少的 epoll 系统调用加起来,有谁能说一定就能明显地快起来呢?

实际上,epoll_wait 的效率是 O(ready fd num) 级别的,因此 edge-trigger 模式的真正优势在于减少了每次 epoll_wait 可能需要返回的 fd 数量,在并发 event 数量极多的情况下能加快 epoll_wait 的处理速度,但别忘了这只是针对 epoll 体系自己而言的提升,与此同时 user app 需要增加复杂的逻辑、花费更多的 cpu/mem 与其配合工作,总体性能收益究竟如何?只有实际测量才知道,无法一概而论。不过,为了降低处理逻辑复杂度,常用的事件处理库大部分都选择了 level-trigger 模式(如 libevent、boost::asio等)

结论:
• epoll 的 edge-trigger 和 level-trigger 模式处理逻辑差异极小,性能测试结果表明常规应用场景 中二者性能差异可以忽略。
• 使用 edge-trigger 的 user app 比使用 level-trigger 的逻辑复杂,出错概率更高。
• edge-trigger 和 level-trigger 的性能差异主要在于 epoll_wait 系统调用的处理速度,是否是 user app 的性能瓶颈需要视应用场景而定,不可一概而论。

欢迎就此话题进行深入调研、讨论!

参考资料:
• linux kernel source:fs/eventpoll.c
• “Comparing and Evaluating epoll, select, and poll Event
Mechanisms”:http://bcr2.uwaterloo.ca/~brecht/papers/getpaper.php?file=ols-2004.pdf
• “Edge-triggered interfaces are too difficult?”:http://lwn.net/Articles/25137/

By QingWu

量子统计(淘宝官方版)基础数据名词解释

【基础统计类】

1、浏览量:店铺各页面被查看的次数。用户多次打开或刷新同一个页面,该指标值累加。
2、访客数:全店各页面的访问人数。所选时间段内,同一访客多次访问会进行去重计算。
3、收藏量:用户访问店铺页面过程中,添加收藏的总次数(包括首页、分类页和宝贝页的收藏次数)。
4、浏览回头客:指前6天内访问过店铺当日又来访问的用户数,所选时间段内会进行去重计算。
5、浏览回头率:浏览回头客占店铺总访客数的百分比。
6、平均访问深度:访问深度,是指用户一次连续访问的店铺页面数(即每次会话浏览的页面数),平均访问深度即用户平均每次连续访问浏览的店铺页面数。【月报-店铺经营概况】中,该指标是所选月份日数据的平均值。
7、跳失率:表示顾客通过相应入口进入,只访问了一个页面就离开的访问次数占该入口总 访问次数的比例。
8、人均店内停留时间(秒):所有访客的访问过程中,平均每次连续访问店铺的停留时间。
9、宝贝页浏览量:店铺宝贝页面被查看的次数,用户每打开或刷新一个宝贝页面,该指标就会增加。
10、宝贝页访客数:店铺宝贝页面的访问人数。所选时间段内,同一访客多次访问会进行去重计算。
11、宝贝页收藏量:用户访问宝贝页面添加收藏的总次数。
12、入店页面:单个用户每次浏览您的店铺时查看的第一个页面为入店页面。
出店页面:单个用户每次浏览您店铺时所查看的最后一个页面为出店页面。
13、入店人次:指从该页面进入店铺的人次。
14、出店人次:指从该页面离开店铺的人次。
15、进店时间:用户打开该页面的时间点,如果用户刷新页面,也会记录下来。
16、停留时间:用户打开本店最后一个页面的时间点减去打开本店第一个页面的时间点(只访问一页的顾客停留时间暂无法获取,这种情况不统计在内,显示为“—”)。
17、到达页浏览量:到达店铺的入口页面的浏览量。
18、平均访问时间:打开该宝贝页面到打开下一个宝贝页面的平均时间间隔。(用户访问该宝贝页后,未点击该页其他链接的情况不统计在内,显示为“—”)
19、全店宝贝查看总人次:指全部宝贝的查看人次之和。
20、搜索次数:在店内搜索关键词或价格区间的次数。

量子统计(淘宝官方版)首页热点图《淘宝店实战一》

我知道,有时候你自己也觉得店铺不太满意,但无奈的是:没有人知道原因。于是抛给美工一句话:“改版,要求只有一点:用户体验好!”所幸的是,现在已经有了很多流量统计工具,可以为我们的改版提供数据支撑,减少了这种悲伤重演。最近,量子统计做出个像样的功能出来——首页点击热图。
稍微解释下什么是热图。热图就是页面中链接被点击次数的记录,然后非常直观的显示在页面中,你就可以很清楚的知道哪个链接点的多哪个链接点的少。但很多人看到热点图后只会为某个链接点击之多而骚动,而除了骚动就是骚动,没有其他有想法。
下面,就给大家分享如何来利用热点图来做一些除了骚动以外可以更骚动的电商数据分析,为改版提供有力的数据支撑。

一、上下对比着看

怎么看出有意义的数据来?见下面的截图,下面的图说明:该店铺从商家信息区域开始点击率不足10%(这是有问题的地方),越往下用户点击越低(这是能看出来的规律),用户关注率也越低(这是思考的结果)。

这意味着什么:
a、顶部用户投入的注意力最多,点击的可能性最大,所以网站顶部需要将一些重要的促销信息放在那个区域。(当然除了首页外也是一样,检查下你的宝贝详细是否也利用了)
b、请注意箭头开始的地方,箭头的上面点击率是在18%~34%的范围,而下面一排直接不足10%,有的甚至更低(找特别)。除了产品差异造成的点击差异外,你不觉得这两个区域跨度有点太大了么?(由于不便于截图太清晰,我这里简单交代下这个图的具体环境,这个截图之上还有挺长的一段促销区域)

是的,用户的注意力集中度也有有限的,经过了一长段促销区以后用户看的快麻木了,注意力开始丢失,再这样一成不变下去你就很难让他鸡冻了,这个时候是否可以 考虑在视觉上进行一些特别的设计冲击下用户?(在PPT演讲中有个10分钟原则,意思是当达到10分钟以后用户注意力将开始丧失,要么10分钟内完成演 讲,要么放段视频放松下用户大脑,要么休息几分钟)而我给出的方案是提供有用数据给用户:把网站的搜索导航的功能区域放置在那个地方点击不足10%的区域(你需要根据你的具体情况给出你的理由)。我的理由是:1、这个时候用户的注意集中力快丢失;2、我们的店铺缺少一个区域来对用户进行导航引导,而搜索与分类是电商中最重要的导航方式,现在已经有76%的用户习惯使用搜索来寻找信息。

接下来的介绍的第二种方法,它也将从数据上支撑我的优化方案。

二、左右对比着看

前面那张图说明,页面越往下点击率越低。但是下面这张图有意思的现象出现了:底部的同一个区域左侧导航比右侧产品区点击明显多(为什么有意思:同一个区域的点击按理应该是差不了太多。这个是找特别)。

这意味着什么?

我们的导航确实是对用户有用的,所以从点击上会比右边的产品点击更多,但是它所处的位置不够好(这是有问题的地方一),用户关注低而且也不方便使用(问题二、三)。所以提出方案:将搜索与导航功能的区域放置在用户点击不足10%的区域(通过上面两种方法综合分析得出的解决方案)。

为了方便大家实战我再总结一下

1、怎么看?
对比着上下看,左右看
2、看什么?
看规律,看有数据差异大的地方,看数据特别的地方。把看到的数据规律先列出来,把有问题的区域记录下来,然后在有问题的地方进行一些优化尝试,在实践中去检验对与错。
当然,有时候你可能需要将几种方法进行组合找规律,找问题。

BY Xiao Bansi

数据可视化的商业之路

数据可视化的概念最早可以追溯到电子计算机产生之前,在当时人们已经意识到数据图形化是向人们展示数据结果的最有效方式,计算机的产生让我们能够迅速处理大量的数据、同时产生大量的新数据,数据量之大已经超出人的直观想象范围,如何将这些数据以一种直观的方式应用到军事、商业运作,成为计算机时代所面临的问题。

在计算机诞生之初,关于应用计算机处理数据并以直观方式显示出来的研究就一直在进行,但是并没有形成一个,独立的学科,在1987年,在华盛顿召开科学计算可视化的会议,确立了将图形和图像技术应用于科学计算是一个全新的领域,对于数据可视化的研究开始进入了井喷的年代。

但是时至今日,数据的图形化不外乎线图、饼图、柱状图及其衍生图表几种方式,而这些表现方式,但是这些表现方式对于信息时代每秒产生的TB级的数据来说已经十分的单薄,人们对于计算机的依赖也要求我们能够寻找到一种更有效、直接的方式来展示数据,让普罗大众们能够在愉快的视觉体验中迅速抓住海量数据背后所表达思想。这也是现在数据可视化的一个热门的方向。我们能够在搜索引擎中搜到好多的数据之美类似的美轮美奂的数据展示作品,但是回过头来我们会发现这些作品的表现形式虽然很美很直观,但是严格意义上只能算是平面作品,并不具有通用性,无法真正在商业中得到应用。

就我知识所及,视觉层面现代的数据可视化应该还会有很长的路要走,传统的数据展示方式作为数据可视化的基础必将在相当长的时间内占据统治地位,但是新的数据呈现方式也在不断地被尝试,但是国内商业应用级别的现代数据可视化研究屈指可数,淘宝量子统计团队和淘宝UED团队合作尝试进行数据可视化的研究已经起步,又一次走在了社会研究的前面。

By Xiaoyu Gao

量子统计“出书啦”!

量子统计很给力!请阅读: