¿Realmente se puede relacionar la implantación ISO 27001 con un descenso en los ciberataques producidos?

Introducción

La creciente preocupación de muchas empresas con infraestructura IT crítica frente a ciberataques ha llevado a algunas de ellas a tomar medidas como: la creación de departamentos de Seguridad de la Información, llevar a cabo auditorías u obtener certificaciones entre otras.

El objetivo de este estudio es tratar de determinar, en la medida de lo posible, si conformar los sistemas de la empresa según la certificación ISO 27001 conlleva una disminución en el número de ciberataques producidos.

Datos analizados

La primera barrera a superar en este estudio es la obtención de datos directos sobre ciberataques. No existe un repositorio oficial con todos los ciberataques producidos, ya que en muchos de ellos no se dan a conocer los nombres de todas las empresas afectadas u otros datos relevantes sobre los mismos, por ello nos basaremos en los ataques reportados en una única web. Además, debido al cambio de formato de los datos de origen con los años, hemos optado por generalizar bastante, lo que nos permitirá hacer un análisis por país, sector o tipo de ataque. Desafortunadamente, esto compromete el análisis, ya que al generalizar los datos son muchos más los efectos que podrian alteran los resultados, ya que existen mayor cantidad de factores externos que este estudio no cubre.

Respecto a los datos de certificaciones ISO 27001, proceden de la fuente oficial asi que se podría considerarsetotalmente fiables.

Los datos que se han recogido para este estudio son:

Lista de países y sectores profesionales que han obtenido certificación ISO 27001 (2007-2015): Web oficial ISO Survey.
Lista de ciberataques producidos (con éxito) por país, sector profesional y tipo de ataque (2012-2016): Hackmageddon.

El análisis se realizará desde 2011 hasta 2016, teniendo en cuenta que los datos de las certificaciones realizadas en un año afectarán a los ataques del año siguiente, por lo tanto no se necesitarán datos de ciberataques en 2011 ni de certificaciones en 2016. Esto es una de las generalizaciones que antes comentabamos, ya que en realidad una certificación podría afectar a los datos de su mismo año, pero no disponemos de fechas exactas para poder cubrir esta relación.

Procesado de los datos sobre certificaciones ISO 27001

De esta fuente se generan tres tablas de datos diferentes, una con las certificaciones a empresas por pais, otra con las certificaciones a web sites por pais y otra con las certificaciones por sector industrial. Aunque el estudio, en su estado actual, solo empleará la primera.

Dicha tabla, para las certificaciones de empresas por país, se presenta con el siguiente formato final:

Country	X2011	X2012	X2013	X2014	X2015	country_short	Continent
Afghanistan	5	0	0	0	5	AF	Asia
Albania	3	2	7	8	22	AL	Europe
Algeria	1	1	2	0	0	DZ	Africa
Andorra	0	0	0	1	1	AD	Europe
Angola	0	0	0	0	0	AO	Africa

La tabla para las certificaciones de web sites por país presenta un formato final muy parecido:

Country	X2011	X2012	X2013	X2014	X2015	country_short	Continent
Afghanistan	0	0	1	0	6	AF	Asia
Albania	3	2	5	8	23	AL	Europe
Algeria	0	1	2	2	5	DZ	Africa
Andorra	0	0	0	2	4	AD	Europe
Angola	0	0	0	0	1	AO	Africa

El proceso para llegar hasta esta apariencia en ambos casos es muy parecido, en primer lugar se sustituyen los datos vacios por ceros para evitar problemas durante la representación gráfica, luego se eliminan aquellas líneas que tengan vacio el campo Country ya que no son de utilidad. Por último, se estandarizan algunos nombres de paises para poder cruzar correctamente los datos con los códigos de dos caracteres especificacos en la ISO correspondiente, y obtener de paso su continente mediante el package de R countrycode.

Para la tabla con las certificaciones por sector industrial el formato es algo más diferente.

	INDUSTRIAL.SECTOR	X2011	X2012	X2013	X2014	X2015
2	Agriculture, fishing	14	13	13	10	9
3	Mining and quarrying	12	31	34	25	8
4	Food products, beverages and tobacco	8	10	24	10	12
5	Textiles and textile products	2	12	10	4	10
6	Leather and leather products	5	1	2	0	1

El procesado es parecido, aunque no se realiza toda la parte relativa al estandarizado de los nombres de los paises, en este caso se estandarizan los diferentes sectores industriales para poder cruzarlos con los datos de los ataques, y se eliminan aquellas lineas con INDUSTRIAL.SECTOR vacío por falta de utilidad.

Procesado de los datos sobre ataques

Como comentabamos antes, aquí es donde encontramos el mayor problema, no existe un organismo que se dedique a mantener un repositorio con datos oficiales sobre ataques producidos. La fuente que se emplea proviene de una web administrada por @paulsparrows, consiste en reportes de la comunidad sobre ataques que se hayan hecho públicos, pero con el paso de los años el formato en que se almacenaban los datos sobre dichos ataques ha evolucionado, lo que nos provoca mayor complejidad a la hora de correlacionar los historicos de diferentes periodos.

La tabla presenta el siguiente formato:

Country	Date	Target	Country_large	Continent	Attack.standar
AM	2016-04-07	Government	Armenia	Asia	Account Hijacking
US	2016-04-15	Government	United States	Americas	Account Hijacking
US	2016-04-13	Education	United States	Americas	Account Hijacking
US	2016-04-05	Healthcare	United States	Americas	Account Hijacking
US	2016-04-04	Education	United States	Americas	Account Hijacking

El procesado requiere varios pasos algo más complejos, que se pueden resumir en los siguientes:

Respecto al campo Country, se eliminan celdas vacias y se estandarizan los valores para coincidir com el estandard ISO de dos caracteres. Además se ignoran aquellos casos en los que no se pudo deducir el significado: H, W, 14, EU, UN, TI y >1. También se desdoblan en varios registros los casos en los que una sola linea referenciaba a varios paises separados por saltos de linea o espacios en blanco. Por último, se procede a cruzar la tabña con los nombres completos de pais y con sus continentes mediante el package countrycode.
Respecto al campo Date, también se eliminan celdas vacias. Además, algunas de las fechas vienen almacenadas en formato númerico con diferentes origenes, por lo que es necesario calcular el origen de cada uno de los diferentes ficheros mediante una calculadora de fechas y aplicarlo correctamente.
Respecto a los otros campos, se realizo una estandarización de los valores para poder cruzarlos correctamente con los datos de las certificaciones. Dicho proceso consistió en sacar todos los valores únicos en ambas fuentes y realizar equivalencias entre ellos. Los principales cambios se realizan en los campos Attack.standar y Target.standar.

Análisis

Evolución general

En primer lugar, como una buena manera de comenzar a intuir si este estudio tiene sentido, se observará la evolución temporal, en general, tanto de los ciberataques reportados, como de las certificaciones realizadas en busca de patrones que puedan indicar una relación entre ambas evoluciones.

Como se puede observar en las gráficas, el número de empresas que obtienen la certificación crece anualmente, mientras que el numero de ataques tiende a descender, aunque es un poco más inestable. Del año 2013 al 2014 el número de ataques se reduce drásticamente, esto puede deberse a un problema en la fuente de datos, ya que al depender directamente de un ser humano pueden existir intervalos en los que se hayan registrado menos datos (por problemas del administrador, como falta de tiempo o interés). Otra explicación plausible, si tenemos en cuenta que las certificaciones de un año afectan a los ataques del año siguiente, es que justo en el año 2013 se produjo una revisión de la certificación, produciendose la ISO 27001:2013 que sustituyó a su predecesora 27001:2005, los cambios realizados pueden consultarse en la web oficial. Por último, también podría influir la diferencia en número de certificados expedidos, teniendo en cuenta el mismo desplazamiento que en el caso anterior, ya que los años en que mayor es la diferencia en certificaciones obtenidas (2013 y 2015) causan una bajada en el número de ataques al año siguiente, y viceversa. Esta última hipótesis es la que le da sentido a este estudio, aunque posiblemente el resto podrían representar la causa, o al menos influir en ella, de la bajada de los ciberataques.

No obstante, para simplificar este estudio, se tratará de analizar más las estimaciones de las gráficas y no tanto las irregularidades de las mismas. Para observar que dichas irregularidades no son tan importantes en realidad, a continuación se representa la evolución de los ataques mes a mes, aunque en el resto del análisis se empleará el año como unidad de tiempo ya que no disponemos de datos más precisos para las certificaciones.

Podemos observar, al aumentar la precisión en el eje X, que los picos en la curva no eran en realidad tan graves en la fuente de datos como parecian. También podemos observar que la tendencia de los ataques realmente tiene una pendiente más o menos negativa, aunque parece que asciende un poco en los ultimos meses.

Por último, aunque se puede observar que existen aproximaciones (como la del último gráfico) que se acercan mucho más a la función real que la lineal, para este estudio se utilizará esta última por simplicidad y como medida de orientación. Teniendo en cuenta esto, si nos basamos en las pendientes de las estimaciones lineales para los ataques y las certificaciones, podremos observar que la pendiente en ataques producidos es negativa (-226.3) y la de las certificaciones es positiva (2532.3), por lo que se puede concluir que el estudio tiene una base real.

Evolución por tipo de ataque

Podría darse el caso de que la certificación tenga una efectividad mayor contra ciertas técnicas de ataque, y que dicha efectividad se camufle entre el resto de técnicas, por ello se contemplará el estudio individual de los diferentes tipos de ataques definidos en la fuente de datos. Existen multitud de ellos, por lo que el estudio se tendrá que centrar en una pequeña parte, los más frecuentes. Para llevar a cabo esta elección se representan a continuación aquellos que representan al menos un 1% del total de ataques producidos.

Como se puede observar en el gráfico anterior, la mayor parte de los ataques registrados en la fuente de datos emplean las siguientes técnicas, que serán las estudiadas a continuación:

Injection: Cualquier tipo de inyección ya sea de código, SQL, etc.
Defacement: Consiste en modificar la apariencia visual de una página web.
DDoS: Trata de saturar un servicio mediante miles de conexiones para evitar que los usuarios legítimos puedan acceder con normalidad.
Account Hijacking: Cuyo objetivo es obtener datos o credenciales de cuentas ajenas.
Malware: Programas que se ejecutan en el sistema de la víctima para llevar a cabo actividades maliciosas.
DNS: Ataques basados en los servidores DNS de la víctima, como el poisoning, que consigue retornar las IPs que no debería a ciertas peticiones.
Zero Day: Son vulnerabilidades recien descubiertas para un servicio o protocolo. Pasa un tiempo hasta que se desarrollan parches o versiones que las corrijan.

Como se puede observar en la evolución temporal reflejada en el gráfico, existen ciertas técnicas que más o menos son constantes en el tiempo, y existen otras que tienen o podrían tener una tendencia con pendiente negativa clara. A continuación se representarán los ataques por separado junto con sus estimaciones lineales para observar qué tendencias tienen una pendiente negativa más clara.

Los tipos de ataque están ordenados por la pendiente de su tendencia, de menor a mayor, para reflejar cuáles están descendiendo más rápido y por lo tanto cuáles podrían reflejar mejor el aumento de certificaciones ISO 27001 expedidas.

Tanto Malware como Account Hijacking tienen una tendencia con pendiente positiva, 20.2 y 10.1 respectivamente.

La tendencia con una mayor pendiente negativa es Injection (-173.5), aunque también DDoS (-49.2) y Defacement (-28.5) presentan unas tendencias con pendientes negativas.

Por otro lado tenemos DNS, cuya tendencia también tiene una pendiente negativa (-3.8), pero es muy moderada asi que podría considerarse estable.

Con estos números se puede concluir que los ataques de tipo Injection, DDoS y Defacement podrían verse afectados positivamente por la certificación ISO 2701, mientras que el resto, aparentemente y con los datos de los que disponemos, no se ven afectados.

Evolución geográfica

Este apartado estudiará la relación entre la certificación ISO 27001 y los ataques producidos, pero teniendo en cuenta la variable geográfica, ya que es posible que la certificación, aunque sea internacional, se implemente o funcione de una mejor o peor forma según la región. En primer lugar se generalizará por continente.

Se puede observar a simple vista que los continentes que reciben más ataques, por lo que podría ser una cuestión lógica de superficie y/o intereses, son por orden: América, Asia y Europa. En cambio, los continentes que mas certificaciones ISO 27001 obtienen son los mismos, pero en distinto orden: Asia, Europa y América.

Tanto África como Oceania serán descartados en el resto del estudio ya que sus porcentajes no parecen relevantes.

Se puede observar que, en conjunto, la pendiente de la tendencia de las certificaciones es creciente, mientras que la de los ataques es decreciente como ocurria en el análisis general. No obstante, se procederá a comparar cada continente individualmente para poder observarlo con más precisión.

En todos los continentes representados parece que se cumple la premisa de que los ataques tienen una tendencia negativa, mientras que las certificaciones positiva. No obstante, parece que el grado no es el mismo, las pendientes en las tendencias lineales difieren un poco entre si.

Continente	Pendiente.Certificaciones	Pendiente.Ciberataques
América	275.2	-100.8
Europa	1209.4	-57.4
Asia	1008.4	-58.4

La tabla muestra que el continente que presenta una menor tendencia ascendente en certificaciones, es el que presenta un mayor descenso en la tendencia de ciberataques. Esto parece que no aporta nada al objetivo del estudio, para poder explicar este suceso y encontrar alguna relación que si nos aporte significado se procederá estableciendo superficies geográficas más pequeñas, aumentando así la precisión. Se mostrarán, a continuación, los paises que superan aproximádamente un 2% de las certificaciones totales y el 1,5% para los ataques (porque Estados Unidos recibe la gran mayoría y si no saldría solo), ya que la lista completa es demasiado extensa. Los nombres serán representados con los dos caracteres correspondientes al estándar ISO que se puede consultar en la web oficial.

Como se puede observar, en la parte de certificaciones destaca Japón sobre los demás paises, que a su vez se encuentra bastante bajo en la lista de ataques. Y, de un modo totalmente contrario, en los ataques destaca Estados Unidos, mientras que este mismo está muy bajo en certificaciones. El estudio continuará en profundidad con el top 3 de paises en número de certificaciones y en número de ataques recibidos, aunque algunos de ellos coincidan. A la izquierda se representará la evolucion de la ISO 27001 y a la derecha la de los ciberataques.

Una vez más, todos los paises parecen cumplir la premisa de un descenso en los ciberataques frente a un ascenso en las certificaciones. No obstante, parece que se vuelven a manifestar irregularidades en las pendientes de las tendencias.

Pais	Pendiente.Certificaciones	Pendiente.Ciberataques
US	210.3	-59.8
GB	320.4	-11.8
IN	268.3	-8.7
JP	262.4	-7.4

Efectivamente, parece que una menor pendiente en las certificaciones genera una mayor pendiente descendente en los ciberataques. Eso si, esta vez de forma más moderada, y parece algo exclusivo de Estados Unidos, ya que en el resto de paises representados se cumple que a mayor ascenso en la pendiente de certificaciones, menor es la pendiente de los ciberataques, lo cual cuadra con el objetivo de este estudio. Parece que la evolución geográfica podría no ser un factor que afectara diréctamente a la efectividad de la ISO 27001.

Evolución geográfica y tipo de ataque

Hasta ahora se han analizado por separado el tipo de ataque y la localización geofráfica, pero la respuesta podría encontrarse en una combinación de las mismas. Para ello se analizarán los tipos de ataque reportados en el país con más certificaciones, Japón, y en el que más ataques recibe, Estados Unidos.

Como se pudo apreciar en un apartado previo, la ISO 27001 parece especialmente efectiva contra las técnicas de Defacement, DDoS e Injection, en el gráfico previo se puede observar que Estados Unidos tiene un menor porcentaje de este tipo de ataques con respecto a Japón, sin embargo también hemos visto que Estados Unidos presenta un descenso mayor en los ataques recibidos que Japón. Para valorarlo mejor, se representará a continuación cómo evolucionan dichos ataques en ambos paises.

Observando las gráficas, parece que se cumplen las conclusiones del apartado previo en el que ciertos tipos de ataques presentan una tendencia negativa ante la ISO 27001, mientras que otros se mantienen o incluso aumentan, lo que parece indicar que la certificación no es lo suficientemente efectiva ante ellos. No obstante, estudiaremos cada caso individualmente en ambos paises para buscar una explicación a las tendencias de Estados Unidos.

Tras analizar las gráficas, se puede comprobar que se cumplen las premisas, los ataques contra los que la ISO 27001 es efectiva presentan en ambos paises una tendencia al descenso, mientras que los calificados como Otros ascienden o se mantienen. No obstante, se procederá a dibujar la tabla de pendientes.

Ataque	Pendiente.Estados.Unidos	Pendiente.Japón
DDoS	-22.4	-0.2
Defacement	-1.8	-0.8
Injection	-55.1	-3.9
Otros	21.2	0.0

Se puede apreciar que el motivo por el que incluso en la actualidad Estados Unidos recibe más ataques (en número) en nuestra fuente de datos es porque tiene un mayor porcentaje de ataques aparentemente infalibles contra la certificación ISO 27001. No obstante, el hecho de que en dicho pais la pendiente del descenso en ataques sea tan baja sigue sin una explicación directa en relación a otro pais.

En conclusión, parece que la certificación ISO 27001 es más efectiva en América que en Asia y Europa, aunque la primera sigue recibiendo muchos más ataques en número.

Conclusiones

Al final de cada apartado se han definido las conclusiones referentes al mismo, no obstante se realizará un resumen y se completarán punto por punto sin tener en cuenta que, en ocasiones con una alta probabilidad, muchas cosas podrían explicarse mediante factores externos o por el un poquito deficiente origen de datos de ciberataques.

La certificación ISO 27001 parece afectar positivamente a la seguridad en las empresas, generando un descenso en el número de ciberataques producidos.
La revisión y actualización de la norma parece generar un mínimo en los periodos inmediatamente consecutivos a su implementación. Aunque, también parece que los ataques se adaptan y reaccionan a algunas circunstancias como puede observarse en la evolución mes a mes del primer apartado.
La certificación ISO 27001 parece no ser igual de efectiva ante todas las técnicas de ciberataques, concretamente parece especialmente efectiva contra: Injection, Defacement y DDoS. Curiosamente las dos primeras refentes a los sitios web de las empresas.
La certificación ISO 27001 parece no ser igual de efectiva en todas las regiones, independientemente de los tipos de ataque recibidos en cada una de ellas, parece que en la región de América funciona mejor que en Europa y Asia. Esto puede que se deba a las costumbres de la zona, u a otras normas de seguridad que se apliquen conjuntamente en esta región.

Por lo tanto, podemos contestar a la pregunta que titula este estudio afirmativamente. De hecho, no solo podemos contestar a la pregunta de una forma general, si no que podemos aportar detalles sobre el comportamiento de la misma.

Trabajo futuro

De cara a un futuro, el estudio podría seguir diversas líneas de investigación resumidas en los siguientes puntos:

Mejorar la fuente de datos de ciberataques. Una fuente cuya administración, recopilación y mantenimiento no dependiera de una sola persona y fuera más constante, homogenea y detallada.
Conectar los datos sobre web sites certificados por país que nos provee la fuente de datos de certificaciones.
Homogenizar los nombres y conectar los datos sobre sectores industriales que nos proveen ambas fuentes.
Investigación más a fondo de los cambios realizados sobre la norma 27001, como la 27001:2013, para relacionarlos con las irregularidades en las curvas de ataques.
Incorporar nuevas variables que puedan afectar al estudio, como parches importantes u otras normas parecidas.

Creemos que la investigación de estas cuestiones puede dar más robustez a las conclusiones expuestas en este estudio.